Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

看板	Stock
作者	IBIZA (溫一壺月光作酒)
時間	2025-01-29 23:20:33
留言	149則留言 (29推 6噓 114→)

看板Stock

: 比較好奇這段： : 儘管蒸餾是AI業界常見做法，但DeepSeek若利用蒸餾技術來打造自家模型，並與OpenAI競爭，將違反OpenAI服務條款，因此產生疑慮。 : OpenAI的服務，或是「利用輸出結果，來開發與OpenAI競爭的模型」。 : 各個ai 大語言模型不是都會互相參照比較和訓練嗎？我以為這是業界常識… : 不過要怎麼定義「與openai 競爭的模型」？因為deepseek 也沒盈利而且也開源學習，他也承認他不只從chatgpt訓練也參照不少，deep seek 也認為自己是chatgpt : 所以是真有盜竊疑慮，還是業界常識的互相學習使用？如何定義這部分各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練能開源的部分只有程式碼, 訓練是看各自調教模型的能力夠, 差不多的調教方式就會得到差不多的結果訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強自從OpenAI爆紅以來, 大公司的LLM模型都是遵循OpenAI的訓練方法預先訓練: 拿大量文本讓AI模型學習基本語言能力、基本知識監督微調: 有了基本能力之後, 模型開始有推理能力這時候由人類介入, 告訴模型怎麼想是對的, 怎麼想是錯的之前所謂的貼標籤, 就是這個階段獎勵建模: 把對錯的判斷建立模型, AI想對了, 這個模型就獎勵他強化學習: AI自己跟自己練習不管是meta還是google, 之前都是照OpenAI這個成功模式做所以這些公司能做的就是拚算力, 透過更大量的訓練, 希望最終可以暴力超車但蒸餾就不同, 蒸餾是直接拿另一個模型的推理結果, 讓另一個模型照著得到同樣結果譬如我要我剛剛問ChatGPT, 要他給舉例說明什麼是擬人法他的回答是這樣 https://i.imgur.com/ey5mX61.png

ChatGPT要回答這個問題, 中間要經過很多推理, 譬如他要先理解我的問題這裡面就牽涉到, 他要理解我講的擬人法是修辭當中的擬人法然後再從這一個理解, 去思考擬人法的意思是甚麼, 最後再想出一個符合範例蒸餾的話, 就是學生模型已經預先知道這個問題的答案是甚麼有頭有尾, 要生出中間的推理就會比較容易但這裡有個問題你要用蒸餾讓一個模型得到另一個模型類似的能力通常就是需要老師模型產生極大量的練習後結果才能傳授畢生功力給學生模型如果ChatGPT是開源模型, 可以自己部署在自己平台上要做這樣大規模訓練是有可能但ChatGPT無法部署在自己平台 (剛剛有人說ChatGPT 2可以, 但蒸餾頂多只能逼近老師, 用ChatGPT 2只能蒸出垃圾) 所以要做蒸餾只能透過API, 而要透過API做幾千萬甚至幾億規模的蒸餾訓練這難度極高啊.... (ChatGPT剛剛教我另一個方法就是拿一個原本就有ChatGPT4能力的模型這樣只要少量訓練, 就能超越ChatGPT 4 但原本就有ChatGPT 4能力的新模型難道自己會生出來嗎XD 你還是得先得到這個模型啊...就是V3 那V3怎麼來?) -- 大規模使用的LLM平台, 會考的範圍就是全部了大規模LLM平台的題庫, 差不多就是全世界所有問題了..

※ 批踢踢實業坊(ptt.cc), 來自: 1.169.68.61 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1738164035.A.04B.html

→ s213092921

推 tangolosss

→ uv5566

推 etset

→ etset

→ good5755

→ IBIZA

→ Windtears

→ IBIZA

推 sickshadow

→ IBIZA

→ saisai34

→ IBIZA

→ saisai34

→ IBIZA

推 lovepork

噓 liscp

→ IBIZA

→ saisai34

→ lovepork

→ IBIZA

推 ohlong

→ IBIZA

推 Aliensoul

→ IBIZA

推 Yahweh

→ IBIZA

→ linzero

→ wangrg

→ IBIZA

推 lovepork

推 gn02118620

→ gn02118620

→ linzero

推 lovepork

→ lovepork

→ IBIZA

→ sunped

→ IBIZA

推 DA3921999

→ DA3921999

推 KrisNYC

→ IBIZA

推 kinda

→ kinda

推 KrisNYC

→ KrisNYC

→ IBIZA

推 ksjr

→ IBIZA

→ kinda

→ jen1121

→ BoyceChu

→ IBIZA

→ kinda

→ saisai34

→ kinda

→ newwu

→ kinda

噓 phoenixtwo

→ saisai34

→ kinda

→ saisai34

→ kinda

→ newwu

推 Flyingheart

→ Flyingheart

→ kinda

→ Flyingheart

→ kinda

推 kotorichan

推 KrisNYC

→ KrisNYC

推 ksjr

→ Sianan

推 KrisNYC

→ KrisNYC

→ ksjr

推 gowet

→ gowet

噓 MoonCode

推 fakelie

噓 sanos168

推 watashino

推 wahaha99

→ wahaha99

推 vi000246

推 blueballer

→ blueballer

推 davis5566

→ davis5566

→ esheep

推 AudiA4Avant

→ dingading

噓 ketter

噓 mdkn35

→ mdkn35

推 straggler7

‣ 返回Stock 看板

Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

您可能感興趣

熱門文章