打不過就要加入他xd
「以前我們稱美帝有三種武器:美軍,美金,美語;現在可以加一個武器:資料」
上個星期北京微軟研究院潘天佑副院長來X-Village, 很精彩的演講, 講述了在他的高度看到的人工智慧技術趨勢及未來。
(最後還一堆人衝到台前問副院長問題,差點害副院長趕不到車子回台北過"付清節"XDD)
而QA時我趁著自己是主持人的身份,自肥問了一個我一直很想知道的問題,我十分好奇,以微軟巨人的身份,怎麼看待"資料霸權"的問題...
在潘副院長的演講中,強調到微軟小冰,在中文的聊天式人工智慧對談服務上,應該已經找不到任何的對手了。最重要的就是,大家持續跟小冰對話,小冰累積的資料更巨大,在準確度上只會讓其它競爭者越來越看不到車尾燈。
回過來看,台灣發展人工智慧是如火如荼的進行中,投入的資源也是十分充足...手上正好在審一個是我科技部計畫超過百倍錢的"人工智慧XXX"計畫...
每次看到這些計畫書,開宗都會寫著:"全世界的科技公司如Google, Facebook微軟等都巨額投入人工智慧研發..."
然而人工智慧的成果,高度依賴大量資料的餵養。扣除如製造業提升良率等應用,多數要跨到異質資料整合,要有使用者分析等資料應用的,都十分辛苦,因為你取得這些資料的成本異常的高。
這種"資料霸權"嚴然存在於提供線上服務的巨人公司。這使得其它單位發展出來的模型,在"資料霸權"餵養出來的AI巨人面前,都只是小朋友。小朋友?那你可能就要靠邊站了。
不對稱的競爭,猶如量級不同的拳擊手在同一個擂台拼搏。
不是做不出頭,當然人定勝天。智慧機械跟智慧醫療領域,我們或可能有機會練成一拳必殺的絕技,上台一拼,因為我們可能有自己的機台跟醫療資料(但同樣,要整合其它的資料,如使用者的社交行為等,又陷回胡同;而且,你怎麼知道這些巨人進不來?)。
現在的數位世界,是高度的不對稱。巨人們擁有"資料霸權",就獨佔數位經濟活動的主要話語權。
過去World Wide Web的發展,造就了這二十幾年來數位經濟的快速成長。WWW帶來的特點,就是公開,平等存取。網路之前,人人平等。這造就幾波.COM爆炸性的產業創新革命。
年輕的世代大量的從Internet得到超越前人所設立的產業屏障機會,很多過去的巨人都在這一波被"下架"。這是一次"知識經濟"革命的具體展現。
然隨之發展了二十多年,我們可以發現,屏障嚴然再度出現。
明眼人看得出來,這個屏障不是人工智慧的技術不對等,而是資料取得的不對等(IBM的人工智慧技術很強,但他就不是現在看到的數位經濟巨人)。
我詢問潘副院長對於這種"資料霸權"的發展,有無改變的可能性?我提出的看法是,歐洲的GDPR正掀起一場對資料擁有權的重視,這一點會不會有帶來什麼變革?
潘副院長從歷史及全球發展上,回答了這個問題。他的看法上,直接點出了關鍵:就是只有吃不到資料經濟的國家,如歐盟跟日本等,可能會在那裡murmur資料擁有權的問題;美國直接靠著擁有全球的資料,從全球賺錢,所以美國對於資料擁有權的問題,大概是只會拖到不得不處理的時候,才會看怎麼解決。
(以前我們稱美帝有三種武器:美軍,美金,美語;現在可以加一個武器:資料)
--
現在的多數AI公司,本質上,都是在窮盡所能的撈各種的資料,去了解他的'客群'。工程師花最多的時間就是整理雜亂收來的資料,然後看能不能湊來用用,用得好,變得好,就賺到。
試著想想...其實這都是撈資料做法的演進而已。
傳統上你也會發現這種資料收集的行為到處都在,像,你到某一個店家,他給了你一個可能都不會去用的優惠卷,然後叫你加入會員,填了一堆你的個人資料;你在路上被正妹干擾填個問卷要要你的喜好資料;你去醫院填了一堆什麼醫生要做研究要你授權他拿你的病例去發paper...etc。
過去就都有很多做法,想透成"資料佔有",取得各種機會優先權。
現在很多的雲端物聯網公司,心中打算的就是佔你的資料,取得各種商業轉化的優先權。
我們過去也碰過很多有這種資料擁有權的爭議,像,健保資料庫的使用,如果政府拿去賣給保險公司,讓他們精算疾病的醫療風險。如果是你,是不是不爽:"我的資料,但你拿去賺錢"!
這句"我的資料,但你拿去賺錢",曾經阻止了很多資料應用的機會~
但說實在的,一般人想的不是"我的資料,但你拿去賺錢",而是:"我的資料,你拿去賺錢,但沒有分給我"!
如果這件事有機會被解放呢?如果,每一個使用者,可以要求他個人的資料,不被你獨有呢?他有權要求下載自己的資料,要求砍掉自己的個人資料呢?
更進一步的,如果,在合約下,對我的資料有興趣者,可以透過跟我買的方式,買我的資料呢?甚至,如果我每天跑幾步的資料,喝幾口水的資料,開幾次電視,看什麼節目的資料,能很容易傳上網,然後你就看到你的帳戶的錢不斷的增加;有不同的人跟你買,你就賺更多錢,有沒有可能有這樣的機會?
這有很多的挑戰,但GDPR其實打開了這個窗戶。
回歸來說我前頭說的"資料霸權"的現象,跟過去WWW帶來的"知識經濟"革命。你會發現可透明化的資料交易模式,將有機會帶來"資料網路"的新革命。
我有資金,我就能拿到資料 <--> 你拿了我的資料,我收到我的合理報酬,我樂於分享更多資料。
"資料霸權"還會存在很久,但如果有這樣的模式出現,你的AI,你的智慧服務,就有機會上大聯盟,跟巨人一摶。
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「google使用者分析」的推薦目錄:
- 關於google使用者分析 在 大詩人的寂寞投資筆記 Facebook 的最讚貼文
- 關於google使用者分析 在 91 敏捷開發之路 Facebook 的最佳貼文
- 關於google使用者分析 在 COMPOTECHAsia電子與電腦 - 陸克文化 Facebook 的最佳貼文
- 關於google使用者分析 在 コバにゃんチャンネル Youtube 的最佳解答
- 關於google使用者分析 在 大象中醫 Youtube 的最讚貼文
- 關於google使用者分析 在 大象中醫 Youtube 的最讚貼文
- 關於google使用者分析 在 GA分析如何分享帳戶權限給其他使用者?新手自學 ... - YouTube 的評價
google使用者分析 在 91 敏捷開發之路 Facebook 的最佳貼文
挺贊同的,在開發團隊該建立的一些共識、規範或標準,這些是新進工程師(不一定是菜鳥)最一開始該熟悉的東西。
--
我挺喜歡 codelabs 的概念,每間公司或多或少都會有自己包的 package 或 component, 應該要有針對這些東西怎麼用、何時用,有什麼限制,以及為何這樣設計,幫助新進工程師了解。
很不錯的六個原則。
https://buzzorange.com/techorange/2016/…/06/google-engineer/
——
以下是我從 Google 工程文化中學到的六個核心原則,你可以從以下各項中學習:
1. 致力共享工具和抽象(abstractions)的工程資源
從很早以前起,Google 對於整個工程組織共用的工具和抽象(abstractions),如 Protocol Buffers、MapReduce、BigTable 等方面密集地投資。 這種好好地一次把問題解決然後讓所有內部的人都能採用的態度最終獲得很高的回報。
每個團隊不用花太大的心力去考慮要使用哪些工具,有專門的工具團隊服務且專注於改善,提高工程團隊的生產力,這些改善很容易傳播給每位已在使用工具或服務的人。
和既有的工程組織(每個團隊可能使用非常不同的工具鏈)形成對比,這一理念也意味著,一旦你已經知道基礎的建構區塊後,便能很容易地理解許多專案背後的設計。這種方法的缺點是,有時你可能會被迫把你的使用案例做些調適,以配合某些特殊支援的工具,甚至它對於你目前的工作來說不是最好的。
2. 為新進工程師投資可重複使用的培訓教材
我能夠迅速在 Google 中有生產力的原因之一是因為 Google 一直以來投入大量資源投入到名為 codelabs 的培訓文件中。
Codelabs 包含了公司的核心抽象層(core abstractions),解釋了為什麼它們被如此設計,突顯程式庫中的相關片段,然後通過幾個實踐的練習驗證理解。沒有這些,我需要更多的時間來了解我能有效率工作所需要知道的眾多技術,這也意味著我的同事不得不花更多的時間向我解釋這些知識。
我在 Google Codelabs 的正面經驗強烈地啟發我後來在 Quora 的 到職流程 推動 codelabs 的決心。
3. 標準化程式設計風格
關於空格、大寫、行長、是否使用 智慧指標(smart pointers)等的每個約定可能單獨看起來微不足道,但是當你達到 Google 的規模時,具有巨大的影響。我不會是第一個承認,當程式碼審查者對我的程式碼挑三揀四,只因為我不正確地縮進一行或因添加兩個字符而超過規定的行列長度很煩的人。
但是因為每個人都遵循相同的規定,瀏覽原始碼明顯地容易許多。在交換團隊或處理跨功能專案時,將需要費點功夫來學習新團隊的規定。當你的團隊小的時候,很容易就忽略的像規定這種事,但隨著程式碼基底(codebase)和團隊成長到某個程度,需要花在變更上的力氣越來越多,你會開始意識到需要一些一致性。
如果可能,儘早規劃團隊一致的規定,或者也可直接使用 Google 開源的樣式指南(style guides)。
4. 透過程式碼審查提高程式碼品質
要求 程式碼審查 並為每個更改以程式來強制執行,減慢了迭代速度,但優化了程式碼的品質。新進工程師將由於收到他們需要的回饋,可快速掌握最佳實踐並收斂程式碼的品質到可接受的水準。
整體上有更高品質的程式碼意味著新進工程師以這品質起始建模,如此將更有可能一開始就寫出更乾淨的程式碼。 因此,程式碼審查是有助於公司擴大規模還能讓所開發的軟體維持高品質的流程。
5. 取得正確的數據(而且要很多)來解決許多問題
Google 研究部主任 Peter Norvig 經常談到「數據由不合理變有效」(註 6)(註 7)(譯註 : 經由合理化模型將許多混亂的文字、圖像和影片變成有效訊息),以解決複雜的問題。
正確的數據可以幫助你了解使用者、分析辦公室政治、解決爭議,並追踪進度。開發日誌和數據基礎架構(例如 Sawzall 和 MapReduce)使 Google 的工程師可以篩選大量數據。
6. 自動化測試以擴展你的程式碼
Google 有非常強大的單元測試文化,「測試在洗手間」是其中一個明顯的案例。幾乎每一個我所做的程式碼修改都伴隨著一個單元測試,程式碼審查人員將嚴格檢查它們。
這使得開發一個指定的變更比較慢,但也意味著成百上千的工程師可以在程式碼基底(codebase)裡相同的部分做擴充與修改,而不犧牲太多的品質或可靠性。 類似投資共享工具的作法,Google 也共享測試框架並致力最佳測試實踐的教育訓練,讓寫測試更加容易。
google使用者分析 在 COMPOTECHAsia電子與電腦 - 陸克文化 Facebook 的最佳貼文
#5G通訊 #物聯網IoT #PXI模組化量測 #電源量測單元SMU
#軟體定義無線電SDR
【設計模擬測試→生產驗證,步步為營】
5G 是個大頻寬與物聯網 (IoT) 窄頻並行不悖的世界,揭幕「少量多樣」的嶄新生產型態,驅使設備供應商須將試運行時程提前,在研發設計之初就著重驗證工作,並思考如何提供加值服務以提升獲利。另一方面,IoT 將是未來推動無線通訊的主要動力;而各類智能裝置 (Smart Devices) 的百花齊放,對 5G 亦有推波助瀾效果。然而,量測工作若還是停留在過去「以待測物為核心」思維,將面臨諸多挑戰;於是,造就模組化儀器如雨後春筍般躍上枱面。
隨著終端裝置趨於「多能工」,只能執行單一量測功能的機台已不敷使用。首先,若使用單機功能量測,必須準備多款機台,工程浩大且量測成本高;其次,下世代的測試往往須涵蓋 2G、3G、4G 和 Wi-Fi,5G 時代導入新頻段後,測試將更複雜!若要像過去以手動調頻逐一測試網路相容性,費事又耗時。於是,以開放平台為基礎的自動化測試設備 (ATE) 繼之而起。使用者不須受限於儀器供應商的制式測試項目,可依個別量測需求、靈活「訂製」適用機台。
以 PXI 模組化量測儀器取代堆疊式設備,可在同一個平台上實現以電源量測單元 (SMU) 測試無線通訊協定或功率、以 DAQ 擷取感測器資料。更重要的是,PXI 可減少從設計到製造的驗證時間;以往基於成本考量,不同工作階段所使用的量測儀器各異,但每轉換一次,工程師就須花費很多時間進行相關性分析;現透過 PXI 開放標準,可將量測功能模組整合到的 ATE 或測試線,從最前端的研發到量產都使用同一套儀器完成,省時省力。
此外,隨著軟體重要性日增,測試範圍不只限於硬體,彈性的「軟體定義無線電」 (Software Defined Radio, SDR) 量測平台開始大行其道,方便使用者分析。
延伸閱讀:
《不只有生產驗證!「模擬測試」及早發現缺陷》
http://compotechasia.com/a/____/2016/0813/32906.html
#國家儀器NI #WLAN Measurement Suite #802.11ax
[本文將於發佈次日下午轉載至 LinkedIn、Twitter 和 Google+ 公司官方專頁,歡迎關注]:
https://www.linkedin.com/company/compotechasia
https://twitter.com/lookCOMPOTECH
https://goo.gl/YU0rHY
google使用者分析 在 GA分析如何分享帳戶權限給其他使用者?新手自學 ... - YouTube 的推薦與評價
在數位行銷領域中,取得數據並做網站 分析 是至關重要的事情,然而 Google Analytics是全世界市占率最高的網站 分析 軟體,在台灣也不例外。 ... <看更多>