Re: [心得] GN 13、14代問題影片重點整理

看板 PC_Shopping
作者 AquariusZi (AZ)
時間 2024-07-22 23:54:24
留言 190則留言 (58推 1噓 131→)

剛看完GN的影片,小弟我想從另一個角度來聊聊 一般半導體廠是怎麼做FA/RA/解issue的 以下長文,且為了方便理解會忽略許多細節與大量相對不準確用語 各路大神若不吝指教,先萬分感謝~~ 依我個人的經驗,當產品出問題時,基本有三條主線要解 1.為什麼會發生,真因(root cause)是什麼 2.如何改善/根除異常,不再產出瑕疵品 3.為什麼瑕疵品會被出貨 第一條主線找真因的部分,Steve說了會委外實驗室來做,但沒特別講怎麼做 這邊非常粗略介紹IC FA其中一種常見的流程 這邊借用IST的圖來一用 https://i.imgur.com/5U4IbsM.png
Step1.電性測試 這邊是要先確認晶片哪組腳位/function是異常的,且是什麼異常 最簡單常見的作法是拿sample測電流電壓的反應曲線(I-V curve) 電測根據結果不同,能很粗略地判斷可能是什麼原因 舉例:電壓通再大電流都躺平是0=>斷路(open)=>可能是開孔分層delam 電壓通大電流增加但不同步=>高阻=>可能是介面層雜質/氧化 沒通電壓卻有電流=>短路(short)=>可能是電遷移 Step2.非破壞檢測 有了第一步的判斷,知道缺陷"可能"長怎樣之後 接下來就是要大範圍(eg. memory controller或是整顆die...XD)尋找可能的故障點 以CPU來說,我看超音波也免了,直接上Xray/3D Xray做定位可能比較快 Step3.前處理 晶片是3D結構,上一步通常只能判斷故障點的2D位置,或是知道很粗略的3D位置 接下來就是要把晶片磨到預定要看的那一層 但如果狀況很複雜,沒辦法判斷缺陷在哪一層,那就會Step3/4之間來回橫跳 Step4.主菜 找到目標點之後就是FIB切下去...前題是有找到就是了 下面是網路上隨便找一張FIB切開的樣子,看看到底長怎樣 https://i.imgur.com/IC2d6H2.png
這時候通常也會搭配XPS看元素成分,阿如果還不夠就請出大神TEM/element mapping 以CPU/SOC來說能走到這一步其實就噴非常*n多錢了 Q跟神山有問題的時候常常是一波爆送30顆樣品去分析,有一兩顆有切中就不錯了 找不到原因回頭切第二波第三波第n波都是非常有可能低 GN送幾顆去如果也能切中真的是祖上積德不然就是I家爛到出汁,隨便切都中 那I家也不要切FIB了,切腹吧 好,假設我們現在知道缺陷長怎樣了 "理論上"就可以下一些手段去做初步的改善 用業界的講法就是D2明確之後就可以下D3然後想D5怎麼下 這個就等GN找實驗室分析的結果或I家自己出來講ㄅ 最後來談可靠度驗證RA(realibility assurance)的部分 這部分是有JEDEC規範的,以我最常接觸的就是HAST系列測試 高溫+高壓+高濕度,還有是否通bias電壓的差別(uHAST vs bHAST) RA的流程跟參數都是有規範的,例如像下面這樣(一樣借用IST的圖): https://i.imgur.com/Gr7f276.png
這樣的業界標準測試不可能不做,也幾乎不可能亂做, 亂做/改RA數據被客戶抓到真的會被告死 但是 與其說QA流程有問題/RA亂做/造假數據/etc... 我更覺得是JEDEC公版測試其實已經越來越不夠用 像上圖中的溫度參數,最嚴苛的是130度,這對一般晶片測試可能已經非常夠用 但對A/I兩家動輒95~100度的工作溫度來說,130度真的還能叫"嚴苛"? 以下是超級不負責任亂猜 1.I家沒有意識到要用更高的標準跑RA,JEDEC pass就pass 2.I家用原本產品規格跑tighten RA,但臨時改規格(eg.頻率)又沒重跑RA,想說hold的住 3.I家Q Lab乖乖過期 4.G桑虎軀一震說給我出,然後準備上法院被電爆 5.掰不下去惹 然後這種RA才看得出來的defect最致命的點在於 一旦RA沒抓到之後大量生產,更不可能回頭做這些測試 生產線的QA就算百百檢也抓不出來 現在I家應該除了內部全力找到原因之外,應該就是努力兜說帖安撫客戶了ㄅ --
※ 批踢踢實業坊(ptt.cc), 來自: 175.182.28.130 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1721663673.A.2F9.html

Windcws9Z: 所以..是QA流程有問題或QC造假數據嗎? 59.127.190.36 07/21 19:55

E7lijah: 樓下噓又在帶風向 27.52.66.205 07/22 23:59

pcfox: 客戶X 律師O 36.231.70.82 07/23 00:01

ss93106ss: 好久不見,可惜這篇沒有掛 118.171.145.86 07/23 00:03

SPDY: 這次災情很難定位 2顆切不到明確病灶不意外122.116.132.101 07/23 00:03

benmei99: 專業推118.231.136.162 07/23 00:04

Depthsharky: 某大師:沒直接點出主因=帶風向? 36.228.229.98 07/23 00:12

yymeow: 這幾天電蝦真的神人輩出,文章品質比其他 114.25.212.97 07/23 00:14

yymeow: 站要好上一截 114.25.212.97 07/23 00:14

mrme945: 某:不管啦,沒有講真因就是帶風向 111.71.212.153 07/23 00:16

jerrychuang: 也可能HTOL電壓設得太低,看不到問題 118.160.140.86 07/23 00:16

jerrychuang: 點 118.160.140.86 07/23 00:16

mrme945: 所以其實我也不是很看好GN他們送檢能夠找 111.71.212.153 07/23 00:17

mrme945: 到根源就是了,但光他願意花那麼多錢送就 111.71.212.153 07/23 00:17

mrme945: 值得給個respect 111.71.212.153 07/23 00:17

Depthsharky: 對阿 超多$$ 可能打水漂 或中大獎 36.228.229.98 07/23 00:19

mrme945: 想問喵編,最近13、14代有賣很差嗎?這次 111.71.212.153 07/23 00:23

mrme945: 事件真的有影響到實際銷售嗎? 111.71.212.153 07/23 00:23

Zenryaku: 一堆專業鄉民跑出來 220.136.95.245 07/23 00:26

AreLies: i5還是賣很好(菸 1.175.235.41 07/23 00:26

Zenryaku: 雖然我都有看沒有懂 220.136.95.245 07/23 00:26

Zenryaku: 大部分人都沒在做功課的吧,店家推什麼 220.136.95.245 07/23 00:27

Zenryaku: 就買什麼,你看前面才一篇買146kf的 220.136.95.245 07/23 00:27

mrme945: 因為我自己體感是覺得對實際銷售似乎沒什 111.71.212.153 07/23 00:28

mrme945: 麼太大影響,畢竟會關注的還是少數 111.71.212.153 07/23 00:28

ctes940008: 品牌機都14代CPU了吧?表示13代已... 36.239.215.108 07/23 00:29

smallreader: 神人輩出m(_ _)m 220.142.66.69 07/23 00:30

ctes940008: 市面上有一大堆可能要重驗證的產品 36.239.215.108 07/23 00:30

Depthsharky: 144 145照賣阿 146K以上也是照賣阿 36.228.229.98 07/23 00:34

Depthsharky: 又不負責修 也沒倒楣到剛售出就出事 36.228.229.98 07/23 00:34

Depthsharky: 吧(X 超過一個月都是跟消費者說找代 36.228.229.98 07/23 00:35

Depthsharky: 理/原廠 跟底部銷售端應該是沒差 36.228.229.98 07/23 00:35

yiting428: intel有問題固然是事實,但youtuber跟 123.195.76.114 07/23 00:36

yiting428: 網路上的說詞也聽聽就好,很多都不懂 123.195.76.114 07/23 00:36

yiting428: 裝懂,出一張嘴最厲害 123.195.76.114 07/23 00:36

Depthsharky: 大環境還能說你那區有沒有跳電(X 36.228.229.98 07/23 00:38

Depthsharky: 要不要買個UPS 36.228.229.98 07/23 00:38

AreLies: 這次問題就是intel也不知道 也解決不了 1.175.235.41 07/23 00:39

AreLies: 大家當然用自己的依據下去猜問題點了 1.175.235.41 07/23 00:39

AreLies: 不然要怎樣 1.175.235.41 07/23 00:39

Depthsharky: 雞尾酒療法自救拉 怎辦 當鴕鳥又不會 36.228.229.98 07/23 00:40

Depthsharky: 解決 36.228.229.98 07/23 00:40

yymeow: 我就說實話了,一定會有人說帶風向 114.25.212.97 07/23 00:40

yymeow: 答案就是沒有。而且至少在台灣,i比A只看 114.25.212.97 07/23 00:40

Koogeal: 37樓發言..頓時水桶蓋突然炸裂了!有沒有 59.115.24.103 07/23 00:41

Koogeal: 掛?? 59.115.24.103 07/23 00:41

AreLies: 從問題爆發以來都更新三波BIOS了 1.175.235.41 07/23 00:41

AreLies: CPU還是爆 是要怎麼辦 嘴砲說沒問題嗎 1.175.235.41 07/23 00:41

yymeow: 量不看銷售值,應該在8:2到7:3之間 114.25.212.97 07/23 00:41

yymeow: 其實從問組機單的i:A也可以看出一二 114.25.212.97 07/23 00:42

ctes940008: A牌還是小眾吧,筆電跟品牌機也少。 36.239.215.108 07/23 00:42

yymeow: 然後因為core ultra 200差不多要上市了 114.25.212.97 07/23 00:42

ctes940008: 尤其現在很多學生也不買筆電都用平板 36.239.215.108 07/23 00:42

AreLies: A筆電跟套裝機是台灣比較少進 1.175.235.41 07/23 00:42

yymeow: 所以各通路13/14代高階的U其實庫存水準應 114.25.212.97 07/23 00:43

ctes940008: 去圖書館發現準備考試的幾乎都用iPad 36.239.215.108 07/23 00:43

yymeow: 該都在低點。通路不怕U賣不出,比較怕板子 114.25.212.97 07/23 00:44

ctes940008: 筆電這幾天大概只看到十台 36.239.215.108 07/23 00:44

yymeow: 清不掉 114.25.212.97 07/23 00:44

yymeow: 要說這事件對通路的困擾就是的確售後需求 114.25.212.97 07/23 00:45

canandmap: 帶風向大師可以提供反證嗎? 36.228.131.46 07/23 00:45

canandmap: 還是只會跳針說在帶風向? 36.228.131.46 07/23 00:45

yymeow: 增加了,這個其實看各站各板出來喵說BSOD 114.25.212.97 07/23 00:45

yymeow: 的文章頻率也可以推知一二 114.25.212.97 07/23 00:45

mrme945: 感謝喵編解答 111.71.212.153 07/23 00:46

mrme945: 所以我說喜歡Intel的其實也不用難過,畢 111.71.212.153 07/23 00:46

mrme945: 竟實際影響真的不大 111.71.212.153 07/23 00:46

mrme945: PTT跟現實世界風向不同也不是第一次了 111.71.212.153 07/23 00:47

yymeow: 有時候看某些推文吹大哥要死了,我看報表 114.25.212.97 07/23 00:47

yymeow: 都有平行世界的感覺:) 有時候還有美股二 114.25.212.97 07/23 00:48

yymeow: 板的感覺 114.25.212.97 07/23 00:48

Depthsharky: 賣自家保固給企業的OEM比較頭疼? 36.228.229.98 07/23 00:49

yymeow: 然後台灣市場跟全球市場其實也有落差 114.25.212.97 07/23 00:49

yymeow: 所以要怎麼自我詮釋其實也無妨。但是回歸 114.25.212.97 07/23 00:51

yymeow: 實際面,真的客人在進行消費時,i或A的品 114.25.212.97 07/23 00:52

yymeow: 牌喜好可能也沒那麼重,尤其是沒有沉浸在 114.25.212.97 07/23 00:52

yymeow: 3C產業的人。打個比方直接問家人CPU有哪兩 114.25.212.97 07/23 00:53

yymeow: 家,可能答案會是華碩蘋果等等也說不一定 114.25.212.97 07/23 00:53

yymeow: 或可能知道英特爾美超微,但是真的要跟各 114.25.212.97 07/23 00:54

yymeow: 位的長輩說英特爾以前只出四核心不長進... 114.25.212.97 07/23 00:55

aaddaaddjack: intel在幹嘛真的匪夷所思,14代是re 23.248.176.108 07/23 00:55

aaddaaddjack: fresh 所以13代有的問題可能14代也 23.248.176.108 07/23 00:55

aaddaaddjack: 解不掉,但是問題就出在13代試產到M 23.248.176.108 07/23 00:55

yymeow: 他們可能就喔喔,好好好。但並不見得會影 114.25.212.97 07/23 00:55

aaddaaddjack: P前這中間完全沒有發現問題嗎? 23.248.176.108 07/23 00:55

aaddaaddjack: 不專業猜可能是fail rate低直接放過 23.248.176.108 07/23 00:55

aaddaaddjack: 或是測項沒有cover到壓力的long run 23.248.176.108 07/23 00:55

aaddaaddjack: ? 只覺得蠻扯的 23.248.176.108 07/23 00:55

yymeow: 響消費決策 114.25.212.97 07/23 00:55

mtc5566: 如果風暴只有這樣 那確實影響不大 如果 118.231.208.21 07/23 01:00

mtc5566: 風暴越演越烈就不好說了 118.231.208.21 07/23 01:00

yymeow: 最主要還是企業客戶跟OEM市場的反饋 114.25.212.97 07/23 01:01

Depthsharky: 角度不同而已 末端小眾消費者/企業 36.228.229.98 07/23 01:02

mtc5566: 就看Intel有沒有辦法擺平阿 最好給力點 118.231.208.21 07/23 01:02

mtc5566: 我還等著抄intc的底勒 118.231.208.21 07/23 01:02

Depthsharky: 通路/代理 光是通路不賣專業維修只做 36.228.229.98 07/23 01:03

Depthsharky: 更換的話 通路哪有影響 36.228.229.98 07/23 01:03

mtc5566: 最好再來個重磅消息 股價跌低一點 118.231.208.21 07/23 01:03

Depthsharky: 會做功課的不會去給小賣店宰 36.228.229.98 07/23 01:03

Depthsharky: 會被宰的不會懷疑到CPU 36.228.229.98 07/23 01:04

Depthsharky: 企業機構那種跟人買服務的就不同了 36.228.229.98 07/23 01:04

Depthsharky: 會找供應方算帳 36.228.229.98 07/23 01:05

yymeow: 同意樓上所言,我也是覺得企客跟OEM才是 114.25.212.97 07/23 01:05

yymeow: 主戰場 114.25.212.97 07/23 01:06

mtc5566: 然後供應商就看INTEL給的好處夠不夠 給得 118.231.208.21 07/23 01:06

mtc5566: 夠當然願意幫忙擦屁股 118.231.208.21 07/23 01:06

mtc5566: 給不夠那就是CEO像P4時期一樣出來下跪道 118.231.208.21 07/23 01:06

mtc5566: 歉,那時候就是抄底intc的最佳時點了 118.231.208.21 07/23 01:06

Depthsharky: 小眾消費端這就是保內RMA跟嘗試延壽 36.228.229.98 07/23 01:07

jay920314: 推 1.200.57.105 07/23 01:08

yymeow: 其實面對企客OEM,要i社拿15去換14/13,應 114.25.212.97 07/23 01:08

yymeow: 該也是做得出來的,順便延長客戶合約,半 114.25.212.97 07/23 01:08

yymeow: 買半送 114.25.212.97 07/23 01:09

mtc5566: 小眾消費端就天生韭菜命 只是這次剛好踢 118.231.208.21 07/23 01:13

mtc5566: 到GN這塊鐵板而已 118.231.208.21 07/23 01:13

dieorrun: GN團隊就專門做這種吃力不討好的203.204.109.206 07/23 01:14

mtc5566: 對這些不做功課的就是不用客氣 揶揄下去 118.231.208.21 07/23 01:15

mtc5566: 就對了他們下次才知道要先做功課 118.231.208.21 07/23 01:15

dieorrun: 就算真給他們切到問題 也不見得能回本203.204.109.206 07/23 01:19

JackSmith: 上次看到CPU大翻車應該是AMD的推土機了 111.240.149.62 07/23 01:25

JackSmith: 只是推土機只是效能不好,I社這次是產 111.240.149.62 07/23 01:25

JackSmith: 品良率有很大的問題 111.240.149.62 07/23 01:26

justice2008: 可以搜尋AMD TLC BUG 114.32.14.43 07/23 01:50

Cubelia: TLB,而不是TLC 111.255.28.25 07/23 01:57

justice2008: 對 記錯了 謝謝 114.32.14.43 07/23 02:05

mtc5566: 然後AMD TLB Bug是飛龍時代 不是推土機 118.231.208.21 07/23 02:10

ganbee: 連不良批次都沒法確定,代表整批都風險批 1.34.242.156 07/23 02:26

ganbee: ,但沒人敢和intel索賠,最後還是真香。 1.34.242.156 07/23 02:26

DuFanSong: 最可悲的是這次問題種種指向INTEL但是111.254.240.163 07/23 02:36

DuFanSong: 現在別說索賠連叫囂一下INTEL也要111.254.240.163 07/23 02:36

DuFanSong: 戰戰兢兢的 完全就是被吃得死死111.254.240.163 07/23 02:37

lwei781: RA 時間完全不夠啊 36.230.97.172 07/23 03:31

amos30627: intel發聲明了 真的有氧化問題 101.9.135.11 07/23 06:26

amos30627: 不過說跟CPU不穩定無關 101.9.135.11 07/23 06:29

kkcity59: 這是打預防針?先承認有氧化? 114.36.246.69 07/23 07:15

kkcity59: 這麼精密的電子元件居然說氧化沒影響歐? 114.36.246.69 07/23 07:17

b325019: GN送兩三顆去切就怕到跳出來先喊有氧化問 1.34.10.185 07/23 07:17

b325019: 題但不是原因所以就是在裝死嘛早就知道問 1.34.10.185 07/23 07:17

b325019: 題了w 1.34.10.185 07/23 07:17

kkcity59: https://reurl.cc/ZeRrZV 114.36.246.69 07/23 07:19

kkcity59: 看來i家是咬死了只要更新BIOS就可解決 114.36.246.69 07/23 07:22

kkcity59: 如果解決不了..你去找你的主機板廠商啊 114.36.246.69 07/23 07:23

poeoe: 沒錯 要切FIB沒那麼簡單切中啦 常常切一堆S 223.139.54.205 07/23 07:26

poeoe: ample都沒切到問題點 223.139.54.205 07/23 07:26

kkcity59: 切已經沒意義啦。i就說會氧化啊 114.36.246.69 07/23 07:30

poeoe: 有些狀況還要調layout來比對 才知道有沒有 223.139.54.205 07/23 07:31

poeoe: 問題 FA沒那麼簡單做啦 223.139.54.205 07/23 07:31

poeoe: 沒有切到問題點 說什麼都沒意義 223.139.54.205 07/23 07:31

kkcity59: 切出來氧化i說是早期庫存嘛 114.36.246.69 07/23 07:32

greg7575: 氧化是地球的錯,地球上氧太多了111.251.240.184 07/23 07:35

greg7575: 你拿這張SEM比較可惜只能做EDX111.251.240.184 07/23 07:40

greg7575: EDX定性容易有雜訊。111.251.240.184 07/23 07:41

greg7575: 確定目標點拿auger出來mapping111.251.240.184 07/23 07:41

greg7575: 爽啊刺啊~~111.251.240.184 07/23 07:41

linfon00: 1X%的不良率... 42.72.255.60 07/23 08:33

ricyear: 重點是RA過了,你inline有變異會重做RA 42.75.79.85 07/23 08:45

ricyear: 嗎? 只要in SPEC 大多是大事化小小事化 42.75.79.85 07/23 08:45

ricyear: 無吧 42.75.79.85 07/23 08:45

widec: 嗯嗯 跟我想的一樣 1.165.8.166 07/23 09:13

EEr404: 專業推 39.15.41.196 07/23 09:24

nooin: 強調已解決2023年的問題就是承認有過問題? 59.125.128.66 07/23 09:41

SPDY: 可能需要誰去追問那批晶片去向 是銷毀了沒?122.116.132.101 07/23 09:54

spr999: 這FIB切出來怎麼都沒窗簾效應也太漂亮, 42.71.174.31 07/23 10:03

spr999: 我切出來都好醜 42.71.174.31 07/23 10:03

ALDNOAH5566: 不良是整批還是某期間或是整個就有 42.73.40.23 07/23 10:03

ALDNOAH5566: 問題還不確定呢 42.73.40.23 07/23 10:03

ALDNOAH5566: 另外有TCT HTST環境是150度可以做 42.73.40.23 07/23 10:08

n00bmaster: 還好我用AMD 36.227.134.161 07/23 10:13

NTUOnline: 但JEDEC不是只有高階才驗阿... 1.162.152.109 07/23 10:19

NTUOnline: 理論上真有問題,應該不分產品線吧? 1.162.152.109 07/23 10:20

SHR4587: 2023也才去年 27.51.67.241 07/23 11:26

SHR4587: 2023年初跟2023年底也是2023,14代也就20 27.51.67.241 07/23 11:28

SHR4587: 24年初發布的,2023年末應該就開始生產 27.51.67.241 07/23 11:28

SHR4587: 的 27.51.67.241 07/23 11:28

Shepherd1987: AZ大說的都是封裝段的可靠度測試 42.72.32.51 07/23 12:29

Shepherd1987: 跟這次GN說的前段不太一樣喔 42.72.32.51 07/23 12:29

cmshow: 看電蝦漲姿勢 61.221.190.253 07/23 12:46

MrDisgrace: 資訊不對稱 一般user哪知道發生什麼事 59.124.162.228 07/23 16:34

a951l753vin: 你太不了解製造業 要做到不被客戶抓 114.137.69.32 07/23 20:40

a951l753vin: 包的方法多的是XD 114.137.69.32 07/23 20:40

a951l753vin: 業務要求生產幾顆 最後能達標 什麼 114.137.69.32 07/23 20:45

a951l753vin: 超產改時間、減少驗證流程 達到客戶 114.137.69.32 07/23 20:45

a951l753vin: 需求量 否則獎金績效怎麼來 114.137.69.32 07/23 20:45

a951l753vin: 看了ID原來是大佬冒犯了… 我是想表 114.137.69.32 07/23 20:51

a951l753vin: 達對外即使說的多麼頭頭是道 對內整 114.137.69.32 07/23 20:51

a951l753vin: 個公司文化才是信心來源 114.137.69.32 07/23 20:51

TISH12311: 對工廠來說合規的都是良品 不是100%無 111.250.6.69 07/23 22:36

TISH12311: 缺陷的才是良品 111.250.6.69 07/23 22:36

asdg62558: 巷子內的 專業 111.82.33.147 07/23 22:53

darkangel119: 每年都要做的ORM 這樣真的會過?118.160.155.239 07/24 03:35

您可能感興趣