阿里巴巴 AI 「看圖回答」 測驗擊敗微軟、臉書、特斯拉,準確率還首次超越人類!
陳宜伶
2021-08-25
看圖回答問題是人類生活及溝通的基本條件,但是對 AI 來說卻是一項高難度任務。
阿里巴巴達摩學院打造出來的 AI 語言模型 AliceMind,幾天前首度打破圖像問答(VQA)世界紀錄,答題準確率甚至超越人類基準,並且擊敗同樣有參加挑戰的微軟、FB 隊伍,象徵達摩學院的人工智慧技術邁出關鍵一步。
VQA 挑戰是什麼?
圖像問答(Visual Question Answering)挑戰的緣起,是因為國際電腦視覺與技術辨識大會 (Conference on Computer Vision and Pattern Recognition,CVPR)希望鼓勵企業攻克 AI 多模態機器學習(MultiModal Machine Learning)的難題,因此從 2015 年開辦 VQA 挑戰賽,吸引來自世界各地的網路企業、科研單位參賽。
今年的 VQA 挑戰賽和往年一樣,題庫包含了超過 25 萬張真實照片,總共有 110 萬道題目。這些題目會考驗 AI 是否能辨別圖像,比如說在一張人群的照片中算出有幾個兒童、或是在圖片中辨認出書桌上的車鑰匙,進而推測房間主人是有車的。
VQA 技術已經被廣泛導入阿里巴巴平台,像是它的 AI 客服機器人「小蜜」(Alime)就已經被淘寶、天貓商家等電商平台採用。消費者輸入問題後,AI 客服會根據商品資訊和顧客問題給出答案。
另一方面,VQA 技術不僅能運用在電商,還可用於醫學圖像辨識,以及電動車的智慧駕駛分析。
阿里巴巴的 AI 模型為何成績能夠超越人類?
這幾年人工智慧(AI)逐漸滲透到各行業,也推動更多科技革命,AI 技術逐漸成為企業數位轉型、對抗疫情,並讓經濟重返正軌的重要力量。
由阿里巴巴達摩學院打造的 AI 深度語言模型系統 AliceMind 在這次的 VQA 測驗中,答題準確率拿到 81.26%,首次超越了人類答題的準確率 80.83% ,更讓馬雲投資的達摩學院在 AI 發展上取得重大進展。
AliceMind 採用了多種專有技術,包括多樣化的視覺表示(diverse visual representations)、「多模態」預訓練語言模型(multimodal pretrained language models)、「跨模態」語義融合和對齊技術( adaptive cross-modal semantic fusion and alignment technology)。這些技術不僅可以讓阿里巴巴的 AI 理解問題並分析圖像,還可以讓 AI 用近似人類的語感回答問題。
阿里巴巴達摩院自然語言處理(NLP)負責人 Si Luo 表示:「這代表我們在『機器學習』領域又取得了一個重要里程碑,AliceMind 在視覺與文本的『多模態』理解及推理上,測試分數媲美人類認知水準,彰顯了我們研發 AI 的努力成效。」
打造出這款 AI 模型的達摩學院是什麼來歷?
2017 年,馬雲認為阿里巴巴應該要把眼光放遠,致力解決未來世界經濟、社會等問題,在此願景下成立了研究單位「達摩學院」( DAMO Academy),號稱要在 3 年投入超過 1000 億人民幣,將重點放在基礎科學和顛覆式技術創新研究上。
Si Luo 表示,人工智慧分為運算智慧、感知智慧、認知智慧及創造智慧 4 個層次。這次 AliceMind 參與的 VQA 測試內容屬於認知智慧部份。
負責人也補充說,這不代表有一天我們會被機器人取代,反而這些智慧機器可以用來輔助我們的日常工作和生活,因此人們可以很專注在他們擅長的創作上。
資料來源:https://buzzorange.com/techorange/2021/08/25/vqa-ai-alibaba/
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「adaptive learning」的推薦目錄:
- 關於adaptive learning 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳解答
- 關於adaptive learning 在 Facebook 的最佳貼文
- 關於adaptive learning 在 Siennylovesdrawing Facebook 的最讚貼文
- 關於adaptive learning 在 コバにゃんチャンネル Youtube 的最佳解答
- 關於adaptive learning 在 大象中醫 Youtube 的最佳解答
- 關於adaptive learning 在 大象中醫 Youtube 的精選貼文
- 關於adaptive learning 在 adaptive-learning · GitHub Topics 的評價
adaptive learning 在 Facebook 的最佳貼文
MOOCs - học Online MIỄN PHÍ
MOOC- Massive Open Online Course - những khoá học mở trực tuyến đại chúng, là những nền tảng mở, hoàn toàn miễn phí và đã được hàng ngàn học viện, trường đại học, danh tiếng gồm cả Harvard, Oxford, MIT, Standford...chia sẻ miễn phí các khoá học của mình. Có hàng ngàn nền tảng như vậy, và mỗi năm có hàng trăm triệu học viên đã học hàng vạn khoá học miễn phí từ hàng ngàn Trường và Viện đại học danh tiếng trên toàn thế giới.
Ở dưới đây là list top 10 những nền tảng đó để các bạn tuỳ nghi lựa chọn và sử dụng - Hầu hết đều Miễn Phí.
1- Classcentral.com: nền tảng "mẹ" list các khoá của các nền tảng khác. Do 2 giáo sư ĐH Stanford sáng lập năm 2012. Hiện có hơn 40.000+ khoá học từ 900+ trường ĐH và hơn 40 Triệu học viên mỗi năm.
2- edX.Org: do Harvard và MIT (2!trường của nhiều tổng thống, danh nhân nước Mỹ) đồng sáng lập 2012. Hơn 10tr học viên, 1500+ khoá học.
3- Futurelearn.com: do đại học Mở Anh Quốc thành lập 2012, 6tr+ học viên, 100 đối tác - chủ yếu các trường đh châu Âu.
4- XuetangX.com: nền tảng đầu tiên của Trung Quốc do đh Thanh Hoa sáng lập 2013.
5- Udacity.com: một start-Up tỷ đô, tập trung sâu vào các khoá học về công nghệ, có cả miễn phí hoàn toàn và miễn phí một phần.
6- Canvas.net: Không nổi trội nhưng khá hữu dụng- các khoá học hay cầm tay chỉ việc do cộng đồng đóng góp.
7-Coursera.Org: do hai giáo sư đáng kính của đh Stanford -(nơi đầu tiên tìm ra pp điều chế vaccine Covid). Có 2000 khoá học online, trong đó có cả các khoá học sau đại học (thạc sĩ, tiến sĩ) hoàn toàn Online.
8- Kadenze.com: thành lập 2013,
Tập trung vào các khoá học sáng tạo và nghệ thuật. Miễn phí khoá đầu tiên.
9- Lagunita.standford.edu: của riêng trường Standford, sử dụng mã nguồn mở.
10- https://cenacademy.vn : nền tảng học online sử dụng công nghệ Adaptive Learning với giáo trình McGrow Hill của Mỹ. Do Cen Academy phát triển. Chuyên tập trung vào các khoá quản trị và kinh doanh Bất Động Sản.
Hầu hết các nền tảng trên đều dùng tiếng Anh. Và có rất nhiều App và nền tảng ngôn ngữ như vậy. Lần sau reviews tiếp.
Cre: Nguyen Phi Van
#CenAcademy
#TeamSharkHung
adaptive learning 在 Siennylovesdrawing Facebook 的最讚貼文
Wow 😲 Time flies ~ What's next from #Aug onwards 😃❓⁉️
Sienny Yong aka Siennylovesdrawing just got a #newcase to protect her Sudio Nio Lemon whenever she is on the go with her favorite earbuds, continue enjoying her #doodling ✍🏻 & #blogging 👩🏻💻📝 passion with a comfy long wearing of Sudio #SudioNio Lemon 💛🍋 as well as continue learning by attending #virtual classes 🖥👩🏻💻/ online conferences 📲💻/ beautiful music 🎶🎵
Really in love 💛 with her 🆕 SudioNio Lemon🍋 for her enjoyment of #sudio #shapingsound while #stayhome #stayhomestaysafe , so a protection case for it is absolutely must have
Full #Tiktok clip via 📹🌐 https://vt.tiktok.com/ZGJARRkur/
It's versatile, absolutely reliable performance with IPX4 rated ingress protection, yes, it means weather proof from rain ☔🌧️ will not ruin your listening excitement. Its adaptive dual-microphone #technology will filter out noises especially whenever on a call. It comes with 4 wing sizes for each user to find suitable & comfortable soundscape on ears👂🏻👂🏻
Let's #shopping for your pair from Sudio via 🛒🌐 https://www.sudio.com/my
A 15% #discountcode "SUDIOTIKTOK" with 🆓 delivery to Malaysia 🇲🇾 & Worldwide 🌍 Ohh ya... It's with a, 3️⃣years #warranty ya 👍🏻😁
#SudioMoments #truewireless #wirelessearbuds #tws #earphone #bluetooth #lifestyle #experience #sharing #sharingiscaring #sound #ProductReview #life #moment #enjoyhome
adaptive learning 在 adaptive-learning · GitHub Topics 的推薦與評價
adaptive-learning ... Data stream analytics: Implement online learning methods to address concept ... Adaptive and automatic gradient boosting computations. ... <看更多>