AI趨勢周報第196期：史丹佛研發陪審團學習方法，要解決標註者造成的ML偏差

by admin · 2022 年 9 月 5 日

史丹佛大學設計陪審團學習方法，先訓練分類器來模擬不同身分標註者的貼標行為，再以虛擬陪審團機制的組合，來驗證效果。

史丹佛大學

重點新聞(0805～0811)

史丹佛大學 陪審團學習 偏差

史丹佛研發陪審團學習方法，要解決標註者分布不均造成的ML偏差問題

史丹佛大學團隊研發一種陪審團學習方法，可控制ML模型輸出值的偏差（Bias），不受到標註者的身分背景影響，例如因標註者的年齡、性別、教育程度、居住地不同而帶來的標註偏差。

他們先是訓練分類器，來模擬不同標註者的標註行為，如女性、黑人，而不像常見的分類器，只模擬一般標註者行為。這種分類器，還能讓使用者依其所需，產出特定標註者的標籤，來對訓練資料貼標。

在實作上，團隊利用社交平臺留言資料集來訓練分類器，讓分類器模擬不同標註者，對這些留言給出的惡意性評分。該資料集包含了17,280位標註者，對留言的惡意性評分（0至4分），每位標註者也提供自己的年齡、性別、種族、教育水準、政黨派別，以及是否為人父母和宗教信仰等特徵。接著，團隊利用BERTweet模型來產生每條留言的表徵，再將這些表徵集結起來，作為Deep & Cross類神經網路的輸入值，來產出不同標註者對留言的評分。在推論上，團隊設置特定特徵組成的虛擬陪審團，讓模型隨機挑選12合適的位標註者，來預測評分，並經多數決選出最佳標籤。團隊發現，模型平均絕對誤差為0.61，在預測不同種族標註者時，模型也有一致的錯誤率，如亞洲人0.62、黑人0.65、西班牙裔0.57、白人0.6。

AI專家吳恩達，陪審團學習方法雖能減少一些偏差，且能確保生成的標籤代表不同觀點，但這個方法，不會減少在人口群體中普遍存在的偏差。後者的問題需要另一種解法。

招潮蟹 MIT 電腦視覺

模擬招潮蟹！MIT專家打造出陸地水下都能看的360度人造眼

MIT電腦科學與人工智慧實驗室CSAIL聯手首爾國立大學，打造一款可同時分辨陸地和水下景象的仿生人造眼系統，外形有如一個黑色的小球，透過混合材質來處理光線訊息，視野不再只限於半球形，而是近360度的全景視角。

團隊表示，這款人造眼是受招潮蟹啟發，因為招潮蟹有獨特的視覺系統，平坦的角膜和漸變折射率處理能力，可解決因外部環境變化而產生的散焦，此外，特殊的眼睛結構還讓招潮蟹具備3D全景視角。因此，團隊將一系列具漸變折射率分布的平面微透鏡，以及梳狀的柔性光電二極管陣列，整合分布在一個3D球體上。

如此，就算光線從多處射出，也會聚集在圖像感測器的同一點上，不論周遭折射率如何變化。為測試系統，團隊將這個人造眼半浸於水中，並在水陸和不同距離之處擺設5個物件。他們發現，不論陸地還是水下，系統可呈現一致的圖像品質，也能呈現近乎360度的陸地和水下景象。

Meta 聊天機器人 BlenderBot 3

Meta開發新演算法Director，要讓新一代Chatbot談吐更有禮貌

Meta以自家的語言模型OPT-175B為基礎，開發出1750億參數的新一代聊天機器人BlenderBot 3，效能比第二代要好31%，再加上以58倍大的資料庫來訓練，第三代的知識量是前一代的2倍，錯誤率則降低47%。

為了讓BlenderBot 3不受有心人濫用、說出沒禮貌的回應，Meta設計一款新學習演算法Director，可利用語言建模和分類方法，來產出BlenderBot 3給用戶的回應。其中的分類器，可訓練來處罰低於標準、有害、矛盾或重複的言論，團隊測試發現，這種方法比獎勵學習機制、重新排名和傳統語言建模方法要好。

電腦視覺 物件偵測 ViTDet

Meta開源新電腦視覺模型，可偵測更多不常見物件

Meta發表最新物件偵測模型ViTDet，經LVIS資料集測試的表現，比其他基於ViT的模型還要好。ViTDet不僅能偵測桌椅等標準物件，還能找出如餵鳥器、花圈和甜甜圈等較不常見的物品。這項研究之所以重要，是因為物件偵測是一項重要的電腦視覺任務，而物件偵測要更有用，就得辨識出更多不常見的物件，或是在訓練資料中很少出現的物件。

產品缺大量曝光嗎?你需要的是一流包裝設計

窩窩觸角包含自媒體、自有平台及其他國家營銷業務等，多角化經營並具有國際觀的永續理念。

推薦評價好的iphone維修中心

擁有專業的維修技術團隊，同時聘請資深iphone手機維修專家，現場說明手機問題，快速修理，沒修好不收錢

有別於傳統方法，Meta僅從單一尺度的特徵圖，就可建構簡單的特徵金字塔，不需用到過去常見的FPN設計，直接用ViT最後一層特徵，就可重建FPN，這種作法更簡單直覺，更不耗費記憶體，訓練和推理的速度也更快。Meta現已開源ViTDet程式碼和訓練方法。

牙周病 影像辨識 TFDA

牙醫科技新創打造牙周病判讀AI，今年拼TFDA取證

國產牙醫科技新創台灣牙e通（dentall）打造牙科影像判讀AI，不只能判斷基本的口腔X光片牙位、分辨牙齒位置和牙肉，還能預測蛀牙病灶和牙周病期別，其中牙周病預測準確率達97%。

2019年，他們與北醫聯手，透過北醫提供去識別化且經標註的牙齒影像，來訓練AI模型。第一階段，他們先訓練模型辨識牙位，比如上下左右排牙齒，目前已能取代人力，自動將散亂的影像自動排序。接著，模型進一步學會辨識牙肉與牙齒位置，有這些基礎後，他們開始打造牙周病偵測AI，根據牙肉和牙齒露出牙肉的比例，以及美國牙周病學會標準，來計算牙周病期別。今年，他們準備申請衛福部食藥署智慧醫材SaMD認證，下一步要整合保險給付，比如模型判斷出第3期別，需要牙周病再生治療，就可整合保險端來簡化給付作業。

Amazon 小樣本學習 Transformer

Amazon小樣本學習模型勝過千億參數大模型

Amazon改良Alexa AI，開發出200億參數的語言模型AlexaTM 20B，只需少量人工輸入，就能在不同語言間，轉移已習得的知識。進一步來說，AlexaTM 20B是以Transformer架構為基礎，只需給幾個任務提示，AlexaTM就能將已學習的知識或任務，從一個語言轉移到另一個語言，且不需要額外的人工標註。

AlexaTM 20B具200億參數，在多種語言任務上優於上千億參數的大模型。有別於大部分Transformer架構的語言模型、只採用解碼器，AlexaTM 20B採序列到序列（seq2seq）的編碼器-解碼器架構，在翻譯和文本摘要的效果優於GPT-3，還支援更多語言，像是阿拉伯語、英語、法語、泰米爾語和泰盧固語等。由於AlexaTM 20B的參數數量較少，再加上Amazon對訓練引擎的改進，AlexaTM 20B在訓練期間的碳足跡，只有GPT-3的五分之一。

印度 即時監控 影像辨識

印度導入AI強化邊境即時監控和社交平臺危險偵測

印度軍方近日宣布導入一套AI系統，來即時監控北部和西部的邊境狀況，以及偵測社交平臺活動，來即時掌握危機狀況。進一步來說，印度與中國、巴基斯坦接壤，長年以來存在不少邊界衝突，為此，印度計畫重用AI來強化軍事能力。比如，他們已採用人臉辨識、語言翻譯（中文到英文）、遠程武器操作站、探雷機器人和入侵偵測系統等，來加強軍事防禦。

而這次導入的AI系統，則搭配印度可疑車輛登記系統，再加上可轉動視角的監視器和熱成像監視器，來即時偵測可疑車輛，並通知士兵阻攔。印度媒體稱，該系統已於8區域上路。

／MIT、Meta、Amazon

攝影 / 王若樸

AI近期新聞

1. 英國未來2年要建無人機專屬高速公路

2. CMU開源ML工具來解決時序事件問題

資料來源：iThome整理，2022年8月

https//www.ithome.com.tw/news/152440

網頁設計最專業,超強功能平台可客製化

窩窩以「數位行銷」「品牌經營」「網站與應用程式」「印刷品設計」等四大主軸，為每一位客戶客製建立行銷脈絡及洞燭市場先機。

網頁設計最專業,超強功能平台可客製化

窩窩以「數位行銷」「品牌經營」「網站與應用程式」「印刷品設計」等四大主軸，為每一位客戶客製建立行銷脈絡及洞燭市場先機。

AI趨勢周報第196期：史丹佛研發陪審團學習方法，要解決標註者造成的ML偏差

重點新聞(0805～0811)

You may also like...

近期文章

分類

彙整

AI趨勢周報第196期：史丹佛研發陪審團學習方法，要解決標註者造成的ML偏差

重點新聞(0805～0811)

You may also like...

中華電信斷線 2022：8月份機房設備進行維護，斷網時間一次看

傳 Apple Watch Series 9 將迎來跳躍式效能升級

瑞典16歲環保少女童貝里 榮獲「另類諾貝爾獎」

近期文章

標籤

分類

彙整

瑞典16歲環保少女童貝里榮獲「另類諾貝爾獎」