看板Tech_Job
https://www.chinatimes.com/newspapers/20221028000240-260204?chdtv
Meta英翻台 全靠閩南語劇
04:10 2022/10/28 工商時報 何英煒
https://images.chinatimes.com/newsphoto/2022-10-28/1024/A13A00_P_02_01.jpg
Meta AI軟體工程師陳鵬仁,是該公司UST部門的主要研發人員,負責語音對語音即時翻譯
,第一個成功做出來的語系為閩南語。來自台灣的他,也透過閩南語的繪本,教小孩熟悉
閩南語。圖/業者提供
Meta上周發表AI技術支援非書寫語音翻譯系統,首先推出的是閩南語系。負責這項開發專
案的AI軟體工程師陳鵬仁來自台灣。26日晚間陳鵬仁接受越洋訪問時表示,此次語言資料
庫來源靠的是台灣閩南語連續劇,這研發過程中,也獲得台大教授李弘毅及陽明交通大學
廖元甫教授實驗室的鼎力相助。
陳鵬仁表示,現在所有的語言翻譯都是以文字為基礎,Meta是第一個實踐語音直接翻譯成
語言的公司。而這也與Meta的目標一致,希望未來在元宇宙時代,大家即時互動時,可以
直接用語言交談,即使是不同語言及語系,可以直接翻譯,不需要透過文字。
Meta負責語音對語音即時翻譯的團隊為Universal Speech Translator(UST,通用語音翻
譯工具),在做出閩南語系的語音翻譯後,陳鵬仁表示,未來的目標將希望語音翻譯更精
準、更順暢、更即時,延遲時間更縮短。
談到研發的困難,他表示「最困難的是資料的蒐集」,沒有文字書寫的語言,通常是資源
匱乏的語言,也沒有足夠的資料以供機器訓練和學習。尤其是閩南語的七聲八調,特定語
氣代表不同意義,是非常不容易的事情。
陳鵬仁表示,研發過程中,獲得許多人的幫助,例如台大的李宏毅教授及陽明交通大學的
廖元甫教授,均將研究室語音資料庫提供給Meta,而來自台灣的閩南語連續劇,也成為資
料庫重要的來源。
至於接下來還會考慮什麼樣的語系,陳鵬仁說,目前尚未定案,但是客語及原住民語言都
是考慮範圍內。目前Meta的語音對語音翻譯還屬於研發及實驗階段,商業化時間點預計在
2~5年後。
Meta創辦人兼執行長祖克柏(Mark Zuckerberg)上周與陳鵬仁在臉書上秀出一段英語與
閩南語對談的即時翻譯影片,該影片獲19萬人按讚,並有184萬人看過。
陳鵬仁表示,該影片上線後,的確收到很多詢問,像是他開民宿的伯父就問他那裡可以買
得到嗎?因為當有外國客人投宿時,此系統將可幫助彼此溝通順暢。
#語系 #語言 #研發 #教授 #資料
--
佛沒說小乘、大乘。上座部佛教馬哈希尊者《具戒經講記》拆穿假佛教
大乘經典的
騙局。
上座部佛教明昆《南傳菩薩道》是
真釋迦牟尼佛的菩薩成佛之道 大乘是
假菩薩成佛之道
妙法蓮華經 華嚴經 心經 金剛經 楞伽經 梵網經菩薩戒 圓覺經 楞嚴經 是
大乘假佛經
阿彌陀佛 藥師佛 是
大乘假佛
觀世音 文殊 普賢 維摩詰 龍樹 地藏王 是
大乘假菩薩
https://www.ptt.cc/bbs/IA/M.1588944610.A.D9C.html
上座部佛教目犍連子帝須和
那先破
偽經大乘十方諸佛
--
一神教和佛教的異端邪說竄改教義史:
正版一神教 正版佛教
猶太教(被山寨版一神教抹黑是
舊約) 上座部佛教(被山寨版佛教抹黑是
小乘)
↓ ↓
第一代山寨版一神教 第一代山寨版佛教
基督教
新約 大乘
↓ ↓
第二代山寨版一神教 第二代山寨版佛教
伊斯蘭教古蘭經(
更新約) 密乘(
更大乘)
例如
妙法蓮華經、華嚴經、大般涅槃經、心經、金剛經、梵網經菩薩戒、圓覺經、楞嚴經
就是
假佛教
大乘經典。
阿彌陀佛、藥師佛、大日如來是假佛教大乘經典瞎掰出來的
大乘假佛。
觀世音、文殊、普賢、維摩詰、龍樹、地藏王是假佛教大乘經典瞎掰出來的
大乘假菩薩。
真正的佛只會說真話不會說假話,
真正的佛說法不會互相矛盾,
不可能會存在違背佛教教義的更偉大佛法(例如「大乘」、「密乘(更大乘)」)。
※ 批踢踢實業坊(ptt.cc), 來自: 111.240.221.44 (臺灣)※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1666930585.A.974.html
→ pigc : 台代表閩南語? 10/28 12:18
→ loadingN : 以下開放客家人靠北 10/28 12:27
推 marsonele : https://i.imgur.com/NAjDBZc.jpg 10/28 12:29
推 ab4daa : 支那閩南語=支語不用翻啦 10/28 12:36
→ gn01705529 : 結果5年後Meta已經倒了 10/28 12:37
噓 samarium : 笑死人一邊說沒文字一邊又有系統能餵ai,靠通靈? 10/28 12:37
→ samarium : ? 10/28 12:37
推 Brioni : 誰說資料只能是文字…. 10/28 13:00
→ slluu2 : 這個臉是誰截圖的 10/28 13:07
推 utn875 : 這概念很有趣,AI跳過文字學講話,這更貼近自然 10/28 13:42
→ odahawk : 結果根本都是台語不是福建話阿 10/28 13:49
→ odahawk : 這是把Python當C++了 10/28 13:50
推 s8402019 : 若要佛法興,唯有僧讚僧,南無阿彌陀佛 10/28 13:57
推 SilentBob : 北七 10/28 14:00
推 bag0831 : 上面噓的那個肯定是雲DL 菜 10/28 14:19
推 matyih : 噓之前自己科普一下很難? 10/28 15:18
推 watashino : 噓的到底? 10/28 15:20
→ watashino : 我搜了一下這位作者 他有做unsupervised的 意即不需 10/28 15:20
→ watashino : 要pair data 很酷 10/28 15:20
推 rxvt : Hokkien 、台灣話都是自然語言形成的名詞,但中時真 10/28 15:36
→ rxvt : 的很政治正確,用一個一百年前不存在的名詞套用在這 10/28 15:36
→ rxvt : 個語言上 10/28 15:36
推 FXW11314 : 音訊也是sequence 為什麼不能餵AI?誰規定一定要有 10/28 15:52
→ FXW11314 : 文字的? 10/28 15:52
→ lovebridget : 額 語音翻譯不是很久了嗎 google助理 siri alexaY 10/28 15:57
推 softflame : 那樓上目前現有的siri可以即時翻台語嗎 10/28 16:14
推 sam92260 : 懷念的小房間 10/28 16:25
推 damnche : 推推 10/28 16:56
推 doverdover : 以後到國外出差,就不能用台語講秘密了 10/28 19:12
推 Murasaki0110: 用文字就是他說的資料量取得簡單太多 10/28 21:48
噓 f12sd2e2aa : 不用給娘家版權費嗎 10/28 22:28
→ Merkle : 干安捏 10/29 14:39
→ ling621 : 閩南話或福佬話才是正確用法 不過會有閩南人小動作 10/29 16:44
→ ling621 : 偷改成"台語" 10/29 16:44
→ ling621 : 看到有閩南人急著拉客家人出來引戰 就知道某族群喜 10/29 16:47
→ ling621 : 歡搞仇恨值 10/29 16:47
噓 strellson : 有些臺灣福佬人真的很愛吃其他族群豆腐,東京都知事 10/29 17:03
→ strellson : 對臺灣福佬人的防疫宣導影片,都知道用臺灣閩南語這 10/29 17:03
→ strellson : 個正確名稱,某些臺灣福佬人真該學學日本人的正確觀 10/29 17:03
→ strellson : 念 10/29 17:03