#真的有支持國台語雙聲道的語音語意平台
#中華電信AI語意雲走出智慧音箱的界線
#語音產業經濟起飛聲音也需要搜尋引擎
運用語音辨識技術STT/ASR與SoundOn合作推出的「AI聲音濾鏡」,即為AI語意雲旗下的最新應用,#目前已收集超過上百萬句的國台語語料。
有別於過往其他業者推出的語音轉文字功能,「AI聲音濾鏡」的核心為Podcast領域專用的語音辨識模型,音檔上傳即自動生成逐字稿,可自動斷句、附加精確時間軸,並可彈性後製編修、自動偵測音檔內「熱詞」產生關鍵字,作為分類標籤,透過在地化優勢,#獨家支援國台語混用的語音辨識。
經SoundOn實測個人化辨識正確率達90%以上,而中華電信也將持續透過AI自主化學習,不斷提升語音辨識精準度。
本土打造的語意雲也會打造成開放平台,目前已著手投入數個潛力十足的應用範圍,如聲音內容輿情分析、語音情緒辨識、Podcast插入廣告投放、語音搜尋自組課程等。
中華電攜手SoundOn 打造聲音搜尋引擎
https://lnkd.in/gsgw8_y
---
www.smarthomelab.tw #智慧家庭實驗室
#智慧家庭 #智能家居 #smarthome #智慧城市 #smartcity
asr語音辨識 在 COMPOTECHAsia電子與電腦 - 陸克文化 Facebook 的最佳解答
#物聯網IoT #自動語音辨識ASR #語音助理 #微控制器MCU #AI加速器 #神經決策處理器NDP #神經網路處理器NPU #光達LiDAR #資安
【語音應用,想像無限~~~】
語音辨識正在成為消費者語音助理的重要元素。去年 9 月,亞馬遜 (Amazon) 再 推「可教學 AI」(Teachable AI) 功能,若遇到 Alexa 不理解的語音命令,用戶可直接透過語音向 Alexa 下達指示、即時傳達定義,無需手動設置偏好或改寫 Alexa 邏輯規則。Alexa 能與用戶即時互動式教學,將這些概念推廣到新的上、下文中,並將其與使用者帳戶連結。
交互式教學還可讓 Alexa 學習「間接表述」,可被授予如何將陳述式語句視為變相命令。隨著 Alexa 語音服務 (Amazon Voice Service, AVS) 越來越強大,不少微控制器 (MCU) 供應商群起響應;而語音助理所肩負的任務越見繁複,亦開啟了 AI 加速器、乃至專用處理器的採用風潮。與此同時,雲端服務供應商 (CSP) 正往專用處理器晶片靠攏,以提升 AI 訓練、推論效能。
根據 2020 年 eMarketer 的一項研究,美國有 38.5% 的人口使用語音助理連接智慧手機或其他小工具,且去年因為居家時間增多,成長率達兩位數。此一趨勢促使主要電商門戶網站開發聊天機器人或使用現有基於語音的集成來增加銷售;肺炎疫情爆發以來,制訂對話商務策略以彌補人際交流,已成商業新手段。此外,利用「原生音頻」做交互式廣告及交互式科幻故事講述,正在發生!……
然而,如何針對自然語言搜索優化?如何創建針對答案引擎優化的內容?是兩大挑戰。AI 語音助理正在重塑消費者和企業與數位技術的交互方式;雖然,語音互動應用存在無限可能,也潛藏風險。一項正式研究揭露:即使沒有麥克風,家中掃地機器人等智能家電也可能被駭客竊聽家庭對話!透過遠程訪問光達 (LiDAR) 讀數對 Roborock 進行遠程竊聽攻擊。
延伸閱讀:
《AI 加速器到專用處理器,語音應用更直觀》
http://www.compotechasia.com/a/feature/2021/0205/47106.html
#亞馬遜Amazon #Alexa語音服務AVS #AZ1 #Inferentia處理器 #意法半導體ST #STM32 #微芯科技Microchip #Trust&Go #WFI32E01PC #PIC32MZW1 #Curiosity開發板 #美信 Maxim #MAX78000 #Syntiant #NDP120 #耐能智慧Kneron #KL720 #聯發科技MediaTek #MT8512 #ToneTag #AdTonos #YoursTruly
asr語音辨識 在 COMPOTECHAsia電子與電腦 - 陸克文化 Facebook 的最佳貼文
#自動語音辨識ASR #微機電MEMS #主動降噪ANC #數位音訊放大器 #聲學活動檢測AAD #駐極體電容式麥克風ECM #壓電式微機械超聲換能器PMUT #自然語言理解NLU
【「壓電式」麥克風將全面崛起?】
受惠於超靈敏的聲波感測器和可解釋語音的複雜機器學習演算法,語音識別技術的準確性越發精進。由上述可知,負責接收音訊的麥克風裝置是第一道關卡,它是將聲波轉為電訊號的「換能器」(Transducer)。
對音質、音場的要求越來越高,音訊訊號鏈中所參與的電子元件也變多;為實現輕薄短小的緊湊設計,微機電 (MEMS) 技術應用漸廣。坊間 MEMS 麥克風元件可分為類比、數位兩類;若麥克風收音僅用於靜默監聽、無需播放,音訊鏈後端不必有編解碼器或音訊轉換器,那麼,數位 MEMS 麥克風顯然是首選;反之,牽涉到音訊播放或語音交互,類比 MEMS 則當仁不讓。
整體而言,MEMS 麥克風由於較傳統駐極體電容式麥克風 (ECM) 擁有更好的音質、靈敏度和定向性,便於從數據獲取上、下文進行有效處理和渲染,且功耗、成本更低,體積也小巧得多。不過,為進一步增強抵抗粉塵/微粒、雨水/汗水、震動及高分貝噪音能力,「壓電式」(Piezoelectric) 麥克風成後起之秀。
「壓電式」MEMS 麥克風採用單層薄膜設計的壓電器件不會在背板間隙夾雜灰塵、空氣或雨水等污染物,影響靈敏度和頻率響應,亦避免膜片黏附於背板上。簡言之,它具備防水、防塵、超高聲學過載點、消除迴聲特性,耐用、啟動快且可自供電,對於細微聲響的收音效果更好,更適用於背景雜音大的空間、長距離、戶外或低頻對話,應用面廣泛,但薄膜器件製造不易是其缺點……。
延伸閱讀:
《語音互動靈敏、通話音質清晰——MEMS 麥克風技壓全場》
http://www.compotechasia.com/a/feature/2021/0205/47107.html
#英飛凌Infineon #XENSIV #IM73A135 #艾邁斯半導體ams #AS3460 #東電化TDK #應美盛InvenSense #T5838 #VesperTechnologies #VM3000 #VM3011 #意法半導體ST #A*STAR #IME #ULVAC #WertelOberfell #ESUBTracks #Picovoice
asr語音辨識 在 語音辨識概觀 的推薦與評價
這個章節想要提的hybrid ASR主要由三個部分組成:Language Model(LM)、Pronunciation Model(PM)、Acoustic Model(AM)。 Language Model. Language ... ... <看更多>
asr語音辨識 在 自動語音辨識ASR #生物測定說話者識別引擎BSI... - Facebook 的推薦與評價
自動語音辨識ASR #生物測定說話者識別引擎BSI #文字轉語音TTS #自然語言處理NLP #汽車電子#嵌入式系統#微控制器MCU #數位訊號處理器DSP ... ... <看更多>
asr語音辨識 在 翻譯與字幕記錄詞彙解釋- YouTube說明 - Google Support 的推薦與評價
ASR :自動語音辨識技術(Automatic Speech Recognition)。YouTube 利用自動語音辨識技術為影片自動產生字幕。這項功能適用以下語言:英文、荷蘭文、法文、德文、義大 ... ... <看更多>