[新聞] Meta英翻台 全靠閩南語劇

看板 Tech_Job
作者 XI (MAN)
時間 2022-10-28 12:15:44
留言 40則留言 (16推 3噓 21→)

https://www.chinatimes.com/newspapers/20221028000240-260204?chdtv Meta英翻台 全靠閩南語劇 04:10 2022/10/28 工商時報 何英煒 https://images.chinatimes.com/newsphoto/2022-10-28/1024/A13A00_P_02_01.jpg
Meta AI軟體工程師陳鵬仁,是該公司UST部門的主要研發人員,負責語音對語音即時翻譯 ,第一個成功做出來的語系為閩南語。來自台灣的他,也透過閩南語的繪本,教小孩熟悉 閩南語。圖/業者提供 Meta上周發表AI技術支援非書寫語音翻譯系統,首先推出的是閩南語系。負責這項開發專 案的AI軟體工程師陳鵬仁來自台灣。26日晚間陳鵬仁接受越洋訪問時表示,此次語言資料 庫來源靠的是台灣閩南語連續劇,這研發過程中,也獲得台大教授李弘毅及陽明交通大學 廖元甫教授實驗室的鼎力相助。 陳鵬仁表示,現在所有的語言翻譯都是以文字為基礎,Meta是第一個實踐語音直接翻譯成 語言的公司。而這也與Meta的目標一致,希望未來在元宇宙時代,大家即時互動時,可以 直接用語言交談,即使是不同語言及語系,可以直接翻譯,不需要透過文字。 Meta負責語音對語音即時翻譯的團隊為Universal Speech Translator(UST,通用語音翻 譯工具),在做出閩南語系的語音翻譯後,陳鵬仁表示,未來的目標將希望語音翻譯更精 準、更順暢、更即時,延遲時間更縮短。 談到研發的困難,他表示「最困難的是資料的蒐集」,沒有文字書寫的語言,通常是資源 匱乏的語言,也沒有足夠的資料以供機器訓練和學習。尤其是閩南語的七聲八調,特定語 氣代表不同意義,是非常不容易的事情。 陳鵬仁表示,研發過程中,獲得許多人的幫助,例如台大的李宏毅教授及陽明交通大學的 廖元甫教授,均將研究室語音資料庫提供給Meta,而來自台灣的閩南語連續劇,也成為資 料庫重要的來源。 至於接下來還會考慮什麼樣的語系,陳鵬仁說,目前尚未定案,但是客語及原住民語言都 是考慮範圍內。目前Meta的語音對語音翻譯還屬於研發及實驗階段,商業化時間點預計在 2~5年後。 Meta創辦人兼執行長祖克柏(Mark Zuckerberg)上周與陳鵬仁在臉書上秀出一段英語與 閩南語對談的即時翻譯影片,該影片獲19萬人按讚,並有184萬人看過。 陳鵬仁表示,該影片上線後,的確收到很多詢問,像是他開民宿的伯父就問他那裡可以買 得到嗎?因為當有外國客人投宿時,此系統將可幫助彼此溝通順暢。 #語系 #語言 #研發 #教授 #資料 -- 沒說小乘大乘上座部佛教馬哈希尊者《具戒經講記》拆穿佛教大乘經典的騙局 上座部佛教明昆《南傳菩薩道》真釋迦牟尼佛的菩薩成佛之道 大乘菩薩成佛之道 妙法蓮華經 華嚴經 心經 金剛經 楞伽經 梵網經菩薩戒 圓覺經 楞嚴經大乘假佛經 阿彌陀佛 藥師佛大乘假觀世音 文殊 普賢 維摩詰 龍樹 地藏王大乘假菩薩 https://www.ptt.cc/bbs/IA/M.1588944610.A.D9C.html 上座部佛教目犍連子帝須那先偽經大乘十方諸佛 --
一神教和佛教的異端邪說竄改教義史: 正版一神教 正版佛教 猶太教(被山寨版一神教抹黑是舊約) 上座部佛教(被山寨版佛教抹黑是小乘) ↓ ↓ 第一代山寨版一神教 第一代山寨版佛教 基督教新約 大乘 ↓ ↓ 第二代山寨版一神教 第二代山寨版佛教 伊斯蘭教古蘭經(更新約) 密乘(更大乘) 例如 妙法蓮華經、華嚴經、大般涅槃經、心經、金剛經、梵網經菩薩戒、圓覺經、楞嚴經 就是佛教大乘經典。 阿彌陀佛、藥師佛、大日如來是假佛教大乘經典瞎掰出來的大乘假佛。 觀世音、文殊、普賢、維摩詰、龍樹、地藏王是假佛教大乘經典瞎掰出來的大乘假菩薩。 真正的佛只會說真話不會說假話真正的佛說法不會互相矛盾不可能會存在違背佛教教義的更偉大佛法(例如「大乘」、「密乘(更大乘)」)。
※ 批踢踢實業坊(ptt.cc), 來自: 111.240.221.44 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1666930585.A.974.html

pigc : 台代表閩南語? 10/28 12:18

loadingN : 以下開放客家人靠北 10/28 12:27

marsonele : https://i.imgur.com/NAjDBZc.jpg 10/28 12:29

ab4daa : 支那閩南語=支語不用翻啦 10/28 12:36

gn01705529 : 結果5年後Meta已經倒了 10/28 12:37

samarium : 笑死人一邊說沒文字一邊又有系統能餵ai,靠通靈? 10/28 12:37

samarium : ? 10/28 12:37

Brioni : 誰說資料只能是文字…. 10/28 13:00

slluu2 : 這個臉是誰截圖的 10/28 13:07

utn875 : 這概念很有趣,AI跳過文字學講話,這更貼近自然 10/28 13:42

odahawk : 結果根本都是台語不是福建話阿 10/28 13:49

odahawk : 這是把Python當C++了 10/28 13:50

s8402019 : 若要佛法興,唯有僧讚僧,南無阿彌陀佛 10/28 13:57

SilentBob : 北七 10/28 14:00

bag0831 : 上面噓的那個肯定是雲DL 菜 10/28 14:19

matyih : 噓之前自己科普一下很難? 10/28 15:18

watashino : 噓的到底? 10/28 15:20

watashino : 我搜了一下這位作者 他有做unsupervised的 意即不需 10/28 15:20

watashino : 要pair data 很酷 10/28 15:20

rxvt : Hokkien 、台灣話都是自然語言形成的名詞,但中時真 10/28 15:36

rxvt : 的很政治正確,用一個一百年前不存在的名詞套用在這 10/28 15:36

rxvt : 個語言上 10/28 15:36

FXW11314 : 音訊也是sequence 為什麼不能餵AI?誰規定一定要有 10/28 15:52

FXW11314 : 文字的? 10/28 15:52

lovebridget : 額 語音翻譯不是很久了嗎 google助理 siri alexaY 10/28 15:57

softflame : 那樓上目前現有的siri可以即時翻台語嗎 10/28 16:14

sam92260 : 懷念的小房間 10/28 16:25

damnche : 推推 10/28 16:56

doverdover : 以後到國外出差,就不能用台語講秘密了 10/28 19:12

Murasaki0110: 用文字就是他說的資料量取得簡單太多 10/28 21:48

f12sd2e2aa : 不用給娘家版權費嗎 10/28 22:28

Merkle : 干安捏 10/29 14:39

ling621 : 閩南話或福佬話才是正確用法 不過會有閩南人小動作 10/29 16:44

ling621 : 偷改成"台語" 10/29 16:44

ling621 : 看到有閩南人急著拉客家人出來引戰 就知道某族群喜 10/29 16:47

ling621 : 歡搞仇恨值 10/29 16:47

strellson : 有些臺灣福佬人真的很愛吃其他族群豆腐,東京都知事 10/29 17:03

strellson : 對臺灣福佬人的防疫宣導影片,都知道用臺灣閩南語這 10/29 17:03

strellson : 個正確名稱,某些臺灣福佬人真該學學日本人的正確觀 10/29 17:03

strellson : 念 10/29 17:03

您可能感興趣