Re: [閒聊] 內政部實價登錄網站

看板 Soft_Job
作者 ckaha (★閃亮數學推理★)
時間 2012-11-15 23:01:59
留言 114則留言 (16推 0噓 98→)

http://udn.com/NEWS/FINANCE/FIN10/7492149.shtml 實在是懶得多說了 你認為的公開那不叫公開 當你要多去跑一次申請流程 就算免費都是流動花費 因為你就是要花人力去做 不過對於某些人來說 好像人力時間都不用算錢 然後使用門檻提升的論調又是倒果為因 是你讓資料變得不是那麼好取得 其他人用正常連結網路的流程去爬網站 請問到底是哪裡妨礙正常使用 除非你有一個令人信服的理由 e.g. 因為這樣的方式會讓經費有限的單位所能供應的頻寬全部被這單一功能所佔光 所以我們改另外提供其他模式開放更方便簡易存取原始資料 問題是實價登錄一個月才更新一次 你改另外放一個地放原始資料會吃掉你多少頻寬? 那像內政部每年都會更新的資料 教育部 中選會等 是不是都應該要把那些資料都鎖起來需要的再去申請就好 如果你還想討論的話 請你先去看看台北市政府怎麼做的再說 不要自己用自己的想法去看外面變化如此快速的世界 : ◆ From: 1.163.165.221 : → IBIZA:1.本來就是有公開的 11/15 22:34 : → IBIZA:2.哪邊的流動花費增加了? 11/15 22:34 : → IBIZA:3.資料使用門檻的提升是因為有人去grab網站, 防礙正常使用 11/15 22:35 : 推 dryman:當初沒有任何人爬網站,單純使用量就把網站塞爆了 11/15 22:37 : → IBIZA:沒有任何人grab網站? 跟據地圖版實價登錄網站的facebook官網 11/15 22:42 : → IBIZA:他們是還沒開放前就已經準備要進去grab資料了吧? 11/15 22:42 : → IBIZA:然後內政部實價登錄網站一開放, 地圖版的官網就開始討論他們 11/15 22:43 : → IBIZA:連上去下載資料的經過 11/15 22:44 : → IBIZA:這叫「當初沒有任何人爬網站」? 11/15 22:44 : → ckaha:crab是正常網路會發生的事情 你要認為是攻擊就定法阻止 11/15 22:45 : → IBIZA:現在不就是設法阻止嗎? 11/15 22:46 : → IBIZA:你要資料去申請嘛 幹嘛用grab的? 11/15 22:46 : → ckaha:樓上根本沒搞懂時價登錄的意義 我已經說了 資料開放 11/15 22:49 -- ◆ From: 1.163.165.221
※ 批踢踢實業坊(ptt.cc)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1352991722.A.985.html

IBIZA:還是那句話 11/15 23:03

IBIZA:你希望政府開放甚麼 請請循途徑去push, 在沒有開放api或是 11/15 23:03

IBIZA:cvs下載等方式之前, 麻煩請用現有方式去申請資料 11/15 23:03

IBIZA:不要grab網站, 佔用一般使用者的頻寬 11/15 23:03

IBIZA:這樣很難懂嗎? 11/15 23:03

ckaha:沒關係 反正會爬的人還是會爬 政府繼續走倒退路 11/15 23:06

ckaha:不難懂 因為我自己就有push過 11/15 23:07

shvanta:ckaha不要在意啦,18124是名人了,他是因為你批政府才來護航 11/15 23:10

shvanta:今天換個黨上去他八成就會支持你的看法了 11/15 23:10

IBIZA:shvanta 不要老是用你的藍綠眼光看事情 11/15 23:11

Wush978:我實在是很想知道爬資料到底錯在哪裡... 11/15 23:12

shvanta:像open data這種東西 本來就是該大力推行的政策 11/15 23:13

Wush978:只要crawler寫好不要導致異常的request頻率,根本不會影響 11/15 23:13

Wush978:其他人的權益 11/15 23:13

shvanta:弄到要爬資料,實在很悲哀 11/15 23:13

dryman:API設計得好,crawler大概只需要一天爬一次資料就夠了... 11/15 23:16

dryman:能用一個response回傳的東西,幹嘛拆成一千份呢 11/15 23:17

jackypan1989:18124門外漢..他只有顏色 11/15 23:38

jackypan1989:基本上政府網站會不會當掉,流量有沒有問題 11/15 23:39

jackypan1989:根本和這些crawler無關 11/15 23:39

jackypan1989:講這些五四三的只是混淆視聽而已 11/15 23:39

shvanta:看到前一篇幾個版友認真在跟他討論就覺得好笑,浪費時間.. 11/15 23:44

StubbornLin:我放棄了 他爽就好 11/15 23:45

nhlsi:其實他的目的已經達到了 11/15 23:46

shvanta:打泥巴戰直到你放棄是他的專長,樓上辛苦了 XD 11/15 23:46

ckaha:我只是覺得這裡是soft_job 起碼還是要有點專業的東西 11/15 23:47

IBIZA:shvanta 泥巴戰不是一向都是你在打嗎?XD 11/15 23:48

mongsq:我贊同18124的看法 11/15 23:48

mongsq:資料的確是公開給你查了 但他沒有義務讓你grab 就算改成圖 11/15 23:50

mongsq:你還是一樣可以查 難道一定要讓程式很容易辨識才叫公開? 11/15 23:51

lemonstar:希望18124只是個普通嘴砲工程師..不要是政府官員XD 11/15 23:51

lemonstar:這樣邁向open data還有點機會 11/15 23:52

StubbornLin:什麼叫改成圖還是一樣可以查? 視障怎麼辦? 11/15 23:52

StubbornLin:政府網站不弄成無障礙友善就算了 還增加障礙 11/15 23:53

mongsq:那原本是字的話視障就可以查? 11/15 23:53

IBIZA:視障 用文字還是圖片有差嗎? 11/15 23:53

ckaha:mongsq你還是先去看看我提供的連結 你的出發點還更糟 11/15 23:53

IBIZA:對一般正常查詢的人 並沒有增加障礙 11/15 23:53

ckaha:有差... 差很多 11/15 23:54

IBIZA:改用圖片只是增加用程式下載的人的障礙 11/15 23:54

StubbornLin:為什麼不能查? 有軟體可以把網頁上文字轉成聲音念出來 11/15 23:54

StubbornLin:圖片是要怎樣發音? 我丟給你一張圖片你發音給我看? 11/15 23:54

ledia:視障都是讓電腦用念字的來 11/15 23:54

ledia:之前還有上 BBS 寫文章跟大家介紹的 11/15 23:55

ckaha:拜託去查一下網頁規範 真的是夠了 越看越像來亂的 11/15 23:56

mongsq:我也有軟體可以把圖片轉成文字啊 你要給個情境視障朋友如何 11/15 23:57

mongsq:使用這個系統嗎 11/15 23:57

ckaha:OCR是不是 請問辨識率多高 還是你的是可以自動加tag 11/15 23:57

dryman:樓上太棒了,請你用那個軟體來讀政府網站看看吧 11/15 23:58

dryman:要能讓視障使用者獨立操作瀏覽網頁喔 11/15 23:58

ckaha:那辨識率多高 反正都要整天擋資訊流通這件事情是不是 11/15 23:58

mongsq:重點根本不是視障朋友 難道網站弄個按鈕可以唸給你聽你們就 11/16 00:18

mongsq:不會吵? 再說你們一開始就是想到視障朋友嗎? 還不是只顧程 11/16 00:18

mongsq:式抓不到資料 然後吵資料不開放還是要讓程式也看得懂才叫無 11/16 00:18

mongsq:障礙? 11/16 00:18

dryman:你以為只要能按鈕可以聽就夠了嗎?網頁若沒充分的語意可讓 11/16 00:20

dryman:程式讀取,程式就無法輔助視障朋友在上面前後瀏覽 11/16 00:20

ckaha:打從一開始就說要 資料開放 了,這資料開放重點就是要存取門 11/16 00:21

ckaha:檻降低 11/16 00:21

dryman:也無法讓google, yahoo, MS bing建檔方便後人搜尋 11/16 00:21

IBIZA:mongsq跟我的重點都不在資料不該開放吧, 而是不要在大眾瀏覽 11/16 00:21

dryman:你說這是不是造成使用障礙? 11/16 00:22

IBIZA:的網頁作grab, 要open data可以push政府釋出 11/16 00:22

IBIZA:這樣大家都方便 11/16 00:22

dryman:啊就跟你說除非你拿下載機器人去砍站,crawler跟你想的根本 11/16 00:23

dryman:不一樣啊 11/16 00:23

IBIZA:這個我知道了 之前誤會真的很抱歉 11/16 00:23

IBIZA:不過我想法還是一樣 程式下載應該去push政府弄程式下載的管 11/16 00:24

IBIZA:道, 不要到大眾瀏覽的頁面來grab 11/16 00:24

Blueshiva:"不要在大眾瀏覽的網頁作grab"?你連上去就是在做grab的 11/16 00:25

Blueshiva:動作,所以請你不要用,謝謝 11/16 00:25

IBIZA:我連上去不會看幾萬筆資料啊..orz 11/16 00:25

IBIZA:我下完查詢之後 大概五秒鐘看一筆資料 11/16 00:26

IBIZA:幾十筆資料大概挑三四筆 然後才作下次查詢 11/16 00:27

IBIZA:人類的查詢動作是這樣的 11/16 00:27

IBIZA:然後一個晚上頂多看個幾十筆上百筆 11/16 00:27

Blueshiva:就跟你說不懂就別裝懂...你以為機器人就是萬箭齊發一秒 11/16 00:27

Blueshiva:送出10萬個request嗎 =_= 11/16 00:27

IBIZA:blueshiva 我沒有說會萬箭齊發 11/16 00:28

IBIZA:不過你要下載幾萬筆資料 就是得送出幾萬個request 分散在 11/16 00:28

IBIZA:好幾天也是幾萬個request 11/16 00:28

Blueshiva:我每天給你三碗飯,分三餐給,你會吃得很爽,一次叫你吃 11/16 00:29

Blueshiva:完你會想吐。一個公開的service幾天撐不了幾萬個request 11/16 00:30

IBIZA:問題是不是只有你這幾萬筆啊... 11/16 00:30

IBIZA:誰知道有多少人在下載...orz 11/16 00:30

Blueshiva:?那是誰的問題?送飯的還是吃飯的? 11/16 00:31

IBIZA:不管是誰的問題 你不要搞到我這個正常使用者啊...orz 11/16 00:31

Blueshiva:所以今天網站本身爛,多幾個人連上就掛點,也是我害的就 11/16 00:32

IBIZA:程式下載就去push政府弄程式下載的管道嘛 11/16 00:32

IBIZA:如果今天是正常使用 那大家都一樣 沒啥好怪的 11/16 00:32

dryman:先別管這個了,你聽過安麗嗎? 11/16 00:32

Blueshiva:是了?那這樣好了,為了表示我的歉意,你把住址給我我幫 11/16 00:32

Blueshiva:你跟內政部買光碟寄給你好了,你可以在自己家慢慢看... 11/16 00:33

IBIZA:我要光碟要幹嘛 我又沒有要幾萬筆資料 11/16 00:33

IBIZA:我只想看 我想買的區域跟路段有哪些物件 價格如何 11/16 00:34

dryman:先別管光碟了,你聽過安麗嗎? 11/16 00:34

Blueshiva:沒關係,為了表示我最大的誠意,其他的資料我送你 11/16 00:34

IBIZA:哦?所以你要出錢囉?那好啊XD 11/16 00:35

IBIZA:我給你住址你就出錢買光碟嗎? 11/16 00:35

Blueshiva:沒關係,只要你別再東扯西扯,這點小錢是ok的 11/16 00:37

IBIZA:那不行 我又不是只看一個月XD 11/16 00:38

CRPKT:申請單工本費? 這不就和暴雪說 aren't you thankful 一樣 11/16 00:41

tonyhsie:IBIZA這串的論點蠻奇怪的.... 11/16 03:44

chargo:畢竟有些人護航的原因不是為了技術啊.. 11/16 07:40

superpai:有言道你是叫不醒裝睡的人 不要浪費時間跟護航家講話了 11/16 07:45

zaknafein:某人應該去當總統府發言人 甚麼都能護航的很好 11/16 08:26

HYL: 好會謠喔~~ 11/16 14:01

peeka:我覺得爬資料沒錯, 他本來就是要開放的東西 11/16 15:10

peeka:頻寬不夠. 開放頻寬阿..不然專門弄一台機器給大家挖資料阿.. 11/16 15:11

peeka:技術上做的到吧, 還是能不影響使用者,又可以達到開放的目的 11/16 15:13

peeka:大家不是笨蛋..似似而非的東西只能虎爛不想動腦的人.. 11/16 15:14

doomdied:工讀生無限跳針 11/16 15:47

carlcarl:他邏輯根本就有問題啊.. 11/16 20:34

AreTheyYou:政府政策明顯封閉 有些人想法也沒救了 11/16 22:41

您可能感興趣