矮化女性和少數種族,OpenAI GPT 模型為何變成 AI 歧視重災區?
作者 品玩 | 發布日期 2021 年 02 月 13 日 0:00 |
機器學習技術近幾年突飛猛進,許多強大 AI 因此誕生。以知名研究機構 OpenAI 開發的語言生成模型 GPT 為例,現在可寫文章、幫人做報表、自動查詢資訊,給用戶很大幫助和便利。
然而,多篇近期論文指出,包括 GPT 等 AI 模型,生成結果包含基於性別和種族的偏見。而這些 AI 模型應用在商業領域,勢必強化歧視偏見對象現象。
卡內基美隆大學 Ryan Steed 和喬治華盛頓大學 Aylin Caliskan 近日發表論文《無監督的方式訓練的影像表示法包含類似人類的偏見》(Image Represnetations Learned With Unsupervised Pre-Training Contain Human-like Biases)。
研究者對 OpenAI 在 GPT-2 基礎上開發的 iGPT 和 Google 的 SimCLR,兩個去年發表的影像生成模型進行系統性測試,發現種族、膚色和性別等指標幾乎原樣複製人類測試物件的偏見和刻板印象。
其中一項測試,研究者用機器生成男女頭像照片為底板,用 iGPT 補完(生成)上半身影像。誇張的事發生了:所有女性生成結果,超過一半影像穿著比基尼或低胸上衣。
男性結果影像,約 42.5% 影像穿和職業有關的上衣,如襯衫、西裝、和服、醫生大衣等;露手臂或穿背心的結果只有 7.5%。
這樣的結果,技術方面的直接原因可能是 iGPT 採用的自迴歸模型機制。研究者進一步發現,用 iGPT 和 SimCLR 對照片和職業相關名詞建立連結時,男人更多和「商務」、「辦公室」等名詞連結,女人更多和「孩子」、「家庭」等連結;白人更多和工具連結,而黑人更多和武器連結。
這篇論文還在 iGPT 和 SimCLR 比對不同種族膚色外觀的人像照片「親和度」(pleasantness),發現阿拉伯穆斯林人士的照片普遍缺乏親和力。
雖然 iGPT 和 SimCLR 模型的具體運作機制有差別,但透過這篇論文,研究者指出這些偏見現象背後的共同原因:無監督學習。
這兩個模型都採用無監督學習 (unsupervised learning),這是機器學習的方法之一,沒有給事先標記好的訓練資料,自動分類或分群匯入的資料。
無監督學習的好處,在於資料標記是繁瑣費時的工作,受制於標記工的程度和條件限制,準確性很難保持一定,標記也會體現人工的偏見歧視,某些領域的資料更缺乏標記資料庫;而無監督學習在這種條件下仍有優秀表現,最近幾年很受歡迎。
然而這篇論文似乎證明,採用無監督學習無法避免人類常見的偏見和歧視。
研究者認為,採用無監督學習的機器學習演算法,出現的偏見歧視來源仍是訓練資料,如網路影像的男性照更多和職業相關,女性照片更多衣著甚少。
另一原因是這些模型採用自迴歸演算法。在機器學習領域,自迴歸演演算法的偏見問題人盡皆知,但嘗試解決這問題的努力並不多。
結果就是,機器學習演算法從初始資料庫學到所有東西,當然包括人類的各種偏見和歧視。
之前 OpenAI 號稱「1700 億參數量」的最新語言生成模型 GPT-3,發表論文也申明因訓練資料來自網路,偏見無法避免,但還是發表並商業化。
去年 12 月,史丹佛和麥克馬斯特大學的研究者另一篇論文《Persistent Anti-Muslim Bias in Large Language Models》,確認 GPT-3 等大規模語言生成模型對穆斯林等常見刻板印象的受害者,確實有嚴重的歧視問題。
具體來說,用相關詞語造句時,GPT-3 多半會將穆斯林和槍擊、炸彈、謀殺和暴力連結。
另一項測試,研究者上傳一張穆斯林女孩的照片,讓模型自動生成一段文字,卻包含明顯的暴力過度遐想和延申,其中有句話「不知為何原因,我渾身是血。」
而當這類演算法應用到現實生活,偏見和歧視將進一步強化。
iGPT 和背後的 OpenAI GPT 技術,現在開發到第三代。能力確實很強大,就像眾多媒體報導過那樣,因此許多商業機構青睞採用。最知名的用戶就是微軟。去年 9 月,微軟 CTO Kevin Scott 宣布和 OpenAI 合作,獨家獲得 GPT-3 授權,將技術應用到針對用戶的各項產品和 AI 解決方案。
微軟尚未透露具體會把 GPT-3 應用到哪些產品,但考慮到微軟產品的十億級用戶量,情況非常令人擔憂。如微軟近幾年 Word、PPT 等產品推廣的自動查詢資訊、文字補完和影像設計功能,當用戶匯入某特定詞或插入圖片時,如果正好落入 GPT-3 的偏見陷阱,結果將非常糟糕。
不僅 GPT,照前述論文說法,所有採用無監督學習的演算法都可能包含這些偏見。現在因無監督學習非常熱門,自然語言處理、電腦視覺等領域,都成為非常關鍵的底層技術。
如翻譯對人際溝通十分重要,但錯誤的翻譯結果,一次被演算法強化的偏見事件,少則切斷人與人的聯繫,更嚴重者將導致不可估量的人身和財產損失。
作者 Steed 和 Caliskan 呼籲,機器學習研究者應該更區別和記錄訓練資料庫的內容,以便未來找到降低模型偏見的更好方法,以及發表模型前應該做更多測試,盡量避免受演算法強化的偏見被帶入模型。
資料來源:https://technews.tw/2021/02/13/openai-gpt-discrimination/
財產分類查詢 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
萬億風口徐徐拉開:資本佈局5G金融
IC咖啡
據美國電信運營商AT&T稱,美國的12個城市已於2018年12月試點5G(第五代移動通信技術),5G商用的第一階段已經打響。
除了美國之外,中國、日本、韓國、歐洲各國等都在積極佈局5G,其中中國的三大運營商已進入“5G”時間,已分別在各城市進行試點。而中國5G推進組於2018年9月啟動的第三階段測試也已接近尾聲,預計在2019年進行5G試商用,2020年正式商用。
眾所周知,4G造就了以智慧手機為核心的移動互聯時代,但在頻寬與時延的限制下,僅實現了一些初級的人工智慧應用的落地。而在5G時代,將有望進入一個真正的萬物互聯的智慧時代,智慧家居、智慧交通、智慧製造都將成為現實,智慧金融也將由初步的概念與形態逐漸水到渠成。
在給人類社會與生活帶來翻天覆地變化的期許背後,是巨額的資本投入與投資機遇。
萬億風口
據全球移動通信協會預計,到2025年,全球5G用戶數將達到13.6億。其中,中國5G用戶總量4.54億。
中國資訊通信研究院在《5G經濟社會影響白皮書》中預測,到2030年,5G有望帶動我國直接經濟產出6.3萬億元、經濟增加值2.9萬億元、就業機會800萬個。
可見5G規劃將是中長週期的生產力持續釋放。
5G建設的重頭戲首先是基站。據業內人士指出,5G通訊的特點是大容量、低功耗和大連接,故基站的建設成本比4G基站成本高很多,或至4G基站的3-4倍。
這意味著5G建設僅在基礎基站投入中就達天量。
中信建投研報預測指出,2019年中國的5G宏站建成量是5萬站,資本支出約1200億;2020年達40萬站,資本支出約2500億;2021年達80萬站,資本支出約3200億;2022年達100萬站,資本支出約2800億。按照該測算,未來3-4年其基站投資額已近萬億。
此外,從中國電信、中國移動、中國聯通、中國廣電等運營商對5G投資的預算及規劃看,大致投資專案分類為:網路規劃、無線主設備、傳輸設備、核心網設備、小基站、光纖光纜、工程建設與服務等,也意味著需要更大規模的投資。在某運營商發佈的投資報告上,其預算投入達1.4萬億。
5G的萬億風口已是全產業鏈共同關注的巨大蛋糕。
金融與5G
近期,以銀行為主的金融行業也開始在5G相關領域落地,多家5G網點的落地令市場關注金融將在5G時代扮演怎樣的角色。
微眾銀行金融科技研究員李思琪撰文指出,回望3G、4G時代,移動通信技術的發展並不直接對金融行業造成影響,但作為重要的基礎設施,其一直為其他技術提供支援。
具體來看,3G時代,智慧手機逐漸普及,金融服務的移動化拉開序幕;4G時代,人工智慧、雲計算、大資料等技術的應用得益於基礎網路速度的提升得到推廣普及,同時,移動互聯網的發展成就了互聯網金融,金融的服務方式和觸達管道得到創新,金融服務的豐富化和便捷化隨之實現,移動支付、手機銀行、互聯網保險等逐漸成為人們生活的一部分。
李思琪推測,5G的出現可能並不像人工智慧等技術一樣可直接運用于金融領域,而是在輔助各新興技術的落地、優化現有技術應用的過程中,實現金融場景的再造,為金融行業注入新的生機。
記者採訪中獲悉,未來金融與5G的結合主要從兩方面有所體現,一為對現有金融服務體驗的升級,二為在萬物互聯場景下金融新業態的產生。
李思琪表示,5G時代網路延遲將縮小至毫秒級,加之邊緣計算的應用,現有金融服務流程間的網路卡頓將不會再被用戶感知,移動端的金融服務,速度和品質都將超乎用戶想像。因此,銀行網點的革新,雲化VR/AR突破設備與網速限制實現支付體驗的升級,以及沉浸式財商教育的普及推廣等都將有所落地,對現有金融業務進行體驗的全方位升級。
此外,萬物互聯的5G時代將有可能解決傳統金融風控、資訊獲取等過程中資訊不對稱的難題。但在物聯網金融模式下,金融機構可通過海量、多態、相互關聯的物品資料識別企業或個人的自然屬性,追蹤他們的行為特徵,不再局限於政府機構的在檔資料和使用者的智慧設備。虛擬經濟得以和實體場景相連接,從而發展出維度更廣、可信度更高金融信用評級體系。
對客戶而言,隨著物聯網的高度應用和物聯終端的普及,大量物品特徵將會數位化,使用者可更全面地借助互聯設備管理自己擁有的實體資產,諸如基於物品感測器的財產保險、基於可穿戴設備的人身保險等險種也將更普及。
進一步而言,智慧城市與智慧金融也將更具落地的可能性。5G將帶來更快的應用程式回應和更廣的設備連接,對金融機構來說意味著更全面的資料、更精准的金融需求,以及無處不在的金融場景。
李思琪指出,在未來的智慧城市中,金融服務和公共服務將全面自動化,銀行帳戶與居民家庭的水、電、氣和熱力表等連接,實現遠端查詢和自動繳費;醫療機構、金融機構與用戶三方互聯,醫生可通過可穿戴設備知曉使用者的身體狀態,而金融機構則結合醫療資料、使用者資料等提供支付、保險、貸款等服務;金融租賃行業依靠感測器即時回傳資料,將更好地管理、檢測出借物的狀態等。萬物互聯為金融服務帶來了融合性更高的金融場景,真正實現金融服務無處不在。
但5G時代顛覆性與創新性的另一面依然是風險。
相比目前相對封閉的移動通信系統,5G意味著更多連接,同時意味著來自網路安全的風險也在增加。此外用戶隱私如何在海量、迅速和開放的系統中更好地得到保護,以及如何確保在數位化時代獲得的資料是真實的,避免資料造假也是接下來需要應對的挑戰。
但不可否認的是,縱然仍有未知的風險,但金融業乃至各行各業,已在步入5G的巨流中。
資料來源:https://mp.weixin.qq.com/s/knK8rd0bzgwdtMoNfgMXJQ…
財產分類查詢 在 鄭運鵬臉書服務處 Facebook 的最佳解答
【避免情緒修法,提供酒駕相關立法資訊讓大家參考】
文長資訊多,先提醒!
因為昨天的酒駕肇事的新聞,我有看到很多朋友在我這邊和其他首長及民意代表臉書留言,大致上都是要求「嚴刑峻法」,這個方向我不反對,但修法怎麼處理到在各種狀況下,[行政裁罰可執行、法官願意判決],這就是這麼多年來,為什麼修法進展不易的原因。
個人身為立法委員,我不願意像部分民代,看報問政,在眾人皆約可殺的時候,喊給大家爽,後續卻無法執行。
希望大家可以理解,峻法不必然帶來嚴刑,沒有裁量的嚴刑,可能造成冤枉,這不應該是現代法治國家需要的法律。
以下,是我目前用手機查詢,過去三年在我公佈議事問政[鄭運鵬專頁]中,有影片的質詢內容(很多在協商條文是的發言,我沒有逐筆放上去),提供給各位參考,讓大家比較了解台灣目前酒駕肇事的現況。
大致上,
1,在酒駕強制移送法辦之後,案件大幅降低一半以上。
2,酒駕無肇事,但移送法辦的案件,已經占了檢察官總案件數1/7到1/8,造成相當大的負擔。
3,酒駕的傷亡,駕駛人傷亡的數字高於被酒駕肇事受害者的人數。
___________________________________
【遏止酒駕─酒駕專章、簡訟重罰】(2016年12月29日,會期最後一次質詢)
很多人沒發現到,台灣是「治安優等生、交通劣等生」,我國一年刑事案件死亡共841人,竟然有高達520人(61.8%)是因為因車禍被撞死(駕駛人死亡還不算數),非常恐怖,賀陳旦部長還認為低估台灣的交通狀況。
其實,交通事故死亡,酒駕只是一環,超速肇事也非常惡劣。但是,中華民國刑法是民國24年的產物,當時可能全中國還沒有幾台汽車,所以架構上根本沒有交通事故的概念。發展到現在,民意趨於嚴格,但是法律還是簡陋,大家一股腦要求移送法辦,因此造成了一年高達5萬多件的酒駕移送,台灣的檢察官卻只有1389人,不但效率差,法官也會輕判。
今天除了交通部,也邀請了法務部及警政署,因此,我把辦公室詹主任研究十多年的「刑法交通事故專章」的概念,提出來和行政機關討論,提出「酒駕專章、簡訟重罰」的四個建議,把所有所有交通事故肇事懲罰的基礎打好:
1、增訂刑法專章:建立交通事故處罰基礎。
2、依違法輕重給予不同處罰:單純酒駕、酒駕肇事、肇事逃逸等等,就有十多種態樣,如果加上超速、蛇行等其他事故原因,專章處理才能把各種不同的處罰層次區分開來。
3、檢察官應對肇事人定額財產保全:專章中,應讓檢察官可代為提出保全程序,對肇事者提出假扣押,受害家屬不需相對提存擔保款,保障賠償、避免肇事人脫產。我認為死亡一人1500萬、受傷一人500萬元以上,是合理的假扣押額度。
4、簡訟重罰、快速處分:訂定專章,目的在於減少檢察官的案量,無肇事者,可以即刻重罰,有肇事者分級重罰,累犯者加倍處分。
另外,我也要求警政署,未來除了酒駕臨檢,也可以將義交、義警、民防、巡守隊,酒促工作者,在飲酒場所協助宣導「酒後不開車」,預防重於治療,相信是更周全的方法。
____________________________________
【酒駕裁罰多管齊下】
(2017年4月26日)
85年12月31日立法院三讀通過強制機車駕駛人及附載座人必須戴安全帽,85年當年車禍死亡人數為7077人。這修法政策,讓交通事故死亡人數大幅減少,104年人數為2922,一年減少死亡4千多人,可說是大功德一件。
目前交通事故死亡已經成多樣化,必須糾正交通行為,以進入第二波救人任務。目前大家注目的焦點,就是如何遏止酒後駕車,今天交通委員會審查議程共有15案,其中有11案有關酒駕。根據警政署得取締酒駕概況,死駕死亡人數有減少趨勢,從100年439人,到104年減少為142人,但是取締案件每年都維持在12萬件左右。
在處理酒駕已有成效下,但移送數量太大,應該分類處理,裁罰模組化,多管齊下,希望能在簡訟重罰下,有效減少酒後駕車。
模組1,刑法訂定交通事故專章。
模組2,逃避酒測最高罰鍰處以45萬。
模組3,酒駕累犯「罰鍰累計」,五年內累計,第一次9萬元,第2次18萬、第3次27萬以此類推,不設上限。
模組4,酒駕累犯「保費累計」,要求交通部針對強制汽車責任保險之加計保費改革,應向金管會爭取,酒駕違規之保費加計,不以前一年為限,至少採計公法請求權年限5年。
______________________________________
【汽車酒駕罰九萬,列車酒駕罰多少?】
(2017年12月25日)
交通委員會這個會期最後一次質詢,是審查台灣鐵路管理局單位預算,賀陳旦部長親自備詢,我一開場就問部長:「汽車酒駕罰九萬,列車酒駕罰多少?」並且本題開放open book,可以立即查詢。
果然所有幕僚官員交頭接耳,馬上有人向部長打PASS,紛紛搖手:「沒有、沒有」!
汽車酒駕罰九萬,並即將累計懲罰,但是影響更多旅客的列車駕駛酒駕,竟然毫無罰則!
(雖然我也能認同列車駕駛酒駕不常發生)
今年十一月新竹路段曾有火車駕駛員發生事故,後來發現駕駛員酒駕,內部調查原因是轉轍器操作有問題才發生事故,記大過處分後移送法辦,酒測數值比照公共危險罪,除此之外沒有任何罰鍰。
火車駕駛員酒駕或許百年難得一見,但必須讓社會感覺標準一致,大眾運輸駕駛應有相同、甚至更重裁罰。
再進一步看,目前除非吐氣超過0.25,才適用公共危險罪,但沒有任何罰鍰,只有內部懲處,相較道路交通管理處罰條例對酒駕的重罰,完全背離民眾的情感。
交通部日前開記者會要求所屬的公務員,若犯酒駕,處罰將重於其他公務員,這應該予以肯定。但是火車、高鐵、捷運比職業駕駛員更專業,要受訓、認證、考試,列車駕駛員社會地位很高,並且負責大眾運輸與旅客安全,軌道運輸不但有專用路權,還有鐵路專法規範,所以犯了酒駕,處分竟比一般駕駛人還輕,實在說不過去。
因此,我對賀陳部長建議,增訂鐵路法之列車駕駛駕罰則:
1,比照道路交通管理處罰條例第三十五條修法精神,增訂行政罰鍰、累計,甚至連坐處罰。
2,酒測方式,應從「上班前」,調整為「每次出車前」。
3,台鐵、高鐵、捷運、林務局、台糖,船舶及航空器等大眾運輸駕駛員通通比照。
希望再一百年也罰不到,但是宣示意義很重要!
https://www.facebook.com/nicepongpong/videos/1642083029418809/
https://www.facebook.com/nicepongpong/videos/1688876314739480/
https://www.facebook.com/nicepongpong/videos/1777265112567266/
財產分類查詢 在 財物標準分類編號查詢校碼 的相關結果
作業模式 校碼 分類編號 年限 單位 財產名稱
查詢 C223 3010111‑21 5 套 靜電除塵器
查詢 C56 3010112‑01 8 套 儀錶控制系統
查詢 C56A 3010112‑06 7 套 電氣控制系統 ... <看更多>
財產分類查詢 在 財產標準分類---號碼查詢 的相關結果
名稱 號碼 單位 主要材質 最低使用年限 備註
木板 3013401‑06 個 木 4 0
涼磚坯木架 3019920‑02 架 木 8 0
檔木板 3030201‑02 塊 鋼鐵 15 0 ... <看更多>
財產分類查詢 在 財物標準分類 - 行政院主計總處 的相關結果
財物 標準分類. _. 網頁功能. 列印內容; Bopomofo. 單元查詢. 主題:. 內容:. 送出查詢 ... 財物標準分類, 108-01-30. 各機關財物報廢分級核定金額表, 112-04-25 ... ... <看更多>