jmsdhn 發表於 2022-5-14 21:41

請教這網頁要如何下載成文字檔

本帖最後由 jmsdhn 於 2022-5-15 13:38 編輯

打擾了
這其實是巷子
https://pastebin.com/raw/Hk2RgYzF
之前用這指令
curl https://pastebin.com/raw/Hk2RgYzF > OUT.txt
是可以存成文字檔的
會把網頁上的字原封不動地抓下來

但最近
用上述指令下載後
內容會變這樣
<!DOCTYPE HTML>
<html lang="en-US">
<head>
<meta http-equiv="X-UA-Compatible" content="IE=Edge" />
<meta name="robots" content="noindex, nofollow" />

等等

感覺是網頁改了
請教這種網頁有cmd指令可用嗎?
感謝教學!

maodou 發表於 2022-5-14 23:00

先看看發生了什麼問題:curl -v https://pastebin.com/raw/Hk2RgYzF

jmsdhn 發表於 2022-5-15 13:37

抱歉!
真的打擾了
感謝大大撥冗回覆

今天該網站好像又修改成可以下載了
也就是恢復到個人之前可以抓到的方式

昨天該不會是剛好遇到的吧
個人是覺得
雖然該網頁在瀏覽器上的顯示內容相同
甚至編排方式也相同

但網主可能改成某種網頁格式
導致curl無效了
網頁個人不是太懂 純猜測

總之他好像又恢復了
不要再變啊!
真的很好用啊!!!
頁: [1]
查看完整版本: 請教這網頁要如何下載成文字檔