跳至內容

維基百科討論:使用時光機

頁面內容不支援其他語言。
維基百科,自由的百科全書


Wayback Machine存檔後的頁面消失

[編輯]

雖然不是維基百科的工具,但是想問問有沒有遇到相同情況的朋友。因條目需要,參考Wikipedia:使用時光機,使用Wayback Machine存檔該頁面後,提示存檔成功並生成了存檔連結,一開始是可以正常查看的,但一段時間後頁面轉而提示「The Wayback Machine has not archived that URL.」,嘗試了兩次都是同樣的情況。該站點似乎並沒有robots.txt文件,並且也存在其他頁面的正常存檔。由於存檔連結已經添加到條目中,在這種情況下是否應該先移除存檔連結呢?--立日留言2021年6月23日 (三) 10:20 (UTC)[回覆]

如果您說的是這筆存檔,我剛剛到web.archive官網上去重新操作一次就成了,您可以在天主教廈門教區下方直接點擊看看,不過紀錄時間是剛剛的下午六點多,也沒看到你先前的存檔,可能有些技術問題吧。此外就算在官網存檔,我也偶爾會遇到類似你說的狀況,要過幾個小時才找的到。如下次再遇到這種情況,我會建議先放着,過至少幾小時到官網上確認有沒有存到檔,沒有就重新存一次。--迴廊彼端留言2021年6月23日 (三) 11:05 (UTC)[回覆]
@迴廊彼端:謝謝,我剛剛可以打開您提供的這版本的存檔,但現在似乎又再次失效了。--立日留言2021年6月23日 (三) 11:26 (UTC)[回覆]
@迴廊彼端:不好意思,似乎是間歇性失效,突然存檔又出現了。感覺不是很穩定的樣子。--立日留言2021年6月23日 (三) 11:31 (UTC)[回覆]

Wayback Machine不能存檔am730的網頁,大家能推薦其它存檔方法嗎?

[編輯]

am730似乎只能從香港訪問,內中報道如[1]在用Wayback Machine存檔時出錯。求推薦其它存檔方法。謝謝!--Benevolen留言2022年1月9日 (日) 03:30 (UTC)[回覆]

去Google搜一下然後看網頁快照,比如你這個。快照--在下荷花請多指教歡迎簽到2022年1月9日 (日) 10:26 (UTC)[回覆]
@Benevolen--在下荷花請多指教歡迎簽到2022年1月9日 (日) 10:26 (UTC)[回覆]
感謝指點!還改為這個功能不復存在了--Benevolen留言2022年1月9日 (日) 20:54 (UTC)[回覆]
看來需要程式設計師開發開源的網頁存檔器以供我們自建。--Txkk留言2022年1月9日 (日) 13:42 (UTC)[回覆]
有了!ArchiveBox --Txkk留言2022年1月10日 (一) 11:57 (UTC)[回覆]

谷歌網頁快照能存檔多久?

[編輯]

我找到一個光明日報來源,但是光明網上的頁面已經被刪除了,然而谷歌網頁快照還存了檔,我現在在該來源的存檔URL里填的網頁快照網址,這個會被谷歌刪除嗎?如何能把谷歌快照的內容備份進web archive?--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月26日 (三) 14:49 (UTC)[回覆]

會刪,不確定保留多久,可能幾周到幾個月吧。archive.is支持存檔和索引(檢索)谷歌快照,但該網站最近似乎下線了。web archive我不確定能否存檔快照,經測可以。以前是不行的,因為robots.txt以前不存、會刪2017年4月開始忽略。--YFdyh000留言2022年10月26日 (三) 17:30 (UTC)[回覆]
「但該網站最近似乎下線了」,並沒有。根據en:archive.today#Cloudflare_DNS_availability所述,用了Cloudflare的DNS服務,可能會打不開這個網站。你用了什麼翻牆軟件?--Txkk留言2022年10月28日 (五) 10:01 (UTC)[回覆]
感謝提示,困擾已久。可能軟件配置和網站問題兼有,出問題時可能在調用OpenDNS。之前訪問總是看到nginx的歡迎頁面,https正常,所以我以為網站故障了。--YFdyh000留言2022年11月1日 (二) 10:20 (UTC)[回覆]
但是我存了以後發現webarchive好像最後存的是光明網首頁,你能試試看怎麼在web archive存谷歌快照嗎--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月27日 (四) 03:42 (UTC)[回覆]
見我那個「可以」的連結。快照頁面會因JS自動跳轉到光明網,必須想辦法(比如禁用JS,或者改URL參數)打開純文字版來存檔。其實不存檔也非不行,應該還有圖書館能查到,不過存檔了更方便查證就是。--YFdyh000留言2022年10月27日 (四) 03:45 (UTC)[回覆]
哦沒事了,存好了--有困擾的話,就讓魔女用魔法幫你排憂吧! 2022年10月27日 (四) 03:44 (UTC)[回覆]
Google 頁庫存檔一段時間後會刪的。建議妳用 https://web.archive.org/save 存檔。 -- Shyangs留言2022年10月26日 (三) 17:38 (UTC)[回覆]
網址不是必須的。--Kethyga留言2022年10月27日 (四) 05:10 (UTC)[回覆]

標題文本

[編輯]

存不了的網站……

昨天晚上發現知乎zhihu.com似乎保存不了……存檔結果是「您當前請求存在異常,暫時限制本次訪問」

應該還有幾個國內大網站不能保存。

  • 淘寶taobao.com
  • 新浪微博weibo.com
  • 網易雲音樂music.163.com

--Zyksnowy留言2022年11月24日 (四) 04:42 (UTC)[回覆]

順路報告,近幾個月,用archive.is查看或存檔知乎頁面,似乎無法成功,且會導致archive.is網站不再能正常訪問(出現異常cookie)。不知道其他人是否能重現。--YFdyh000留言2022年11月24日 (四) 05:39 (UTC)[回覆]
這四個網站都有單獨的圖片服務器,可以單獨保存……可能容易丟失網址

提議對WP:WBM達成共識,對條目內連結儘量在未失效前進行網頁存檔

[編輯]
下列討論已經關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。

因為WP:WBM只是論述,不屬於方針或指引,為避免出現網頁失效,提議將WP:WBM達成共識,規範使用網站時光機,對網頁預防性進行保護,同時有方針指引可儘量避免發生不必要的編輯戰。——航站區留言2024年9月18日 (三) 15:36 (UTC)[回覆]

首先,這是操作指南;其次,從你的發言中可以看出你並不理解什麼是「共識」。--自由雨日🌧️留言貢獻 2024年9月18日 (三) 15:42 (UTC)[回覆]
我對於共識的理解來源於WP:CON,另外我說的是把WP:WBM達成共識,規範使用網站時光機,以免沒任何約束性,每個編者可以根據自己的習慣或者喜好,想加就加想刪就刪,避免編輯戰的出現--航站區留言2024年9月18日 (三) 15:55 (UTC)[回覆]
請解釋約束性和為何能避免編輯戰。--YFdyh000留言2024年9月18日 (三) 18:28 (UTC)[回覆]
沒有約束 你覺得加也是對的 他覺得減也是對的 就會出現編輯戰,例如Special:Diff/84256834Special:Diff/84256939Special:Diff/84257817Special:Diff/84258012Special:Diff/84258178--航站區留言2024年9月18日 (三) 18:37 (UTC)[回覆]
實際上任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,況且維基還有機械人InternetArchiveBot,我的看法是不應強制用戶使用IABotManagementConsole或手動添加存檔網址,也不用特別鼓勵或建議。反而是如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,應嚴禁其他用戶復原或刪除相關編輯。--HanTsî留言2024年9月18日 (三) 18:52 (UTC)+1 [回覆]
你這個觀點我認同,畢竟沒有規矩不成方圓--航站區留言2024年9月18日 (三) 19:02 (UTC)[回覆]
支持。--糯米花留言2024年9月18日 (三) 22:38 (UTC)[回覆]
(+)支持,不強制添加,但添加後不應刪除。--Uyi liu2 幸泉居士✍️ 2024年9月19日 (四) 01:24 (UTC)[回覆]
「應嚴禁其他用戶復原或刪除相關編輯」,IABot出過好幾次故障了,更何況嚴禁的話,是否有考慮任何不應嚴禁的特殊情況?--百無一用是書生 () 2024年9月19日 (四) 02:07 (UTC)[回覆]
能夠形成一個共識即可,以免公說公有理婆說婆有理--航站區留言2024年9月19日 (四) 02:21 (UTC)[回覆]
故障的編輯直接視同為破壞處理就行了。--HanTsî留言2024年9月19日 (四) 04:34 (UTC)[回覆]
這裏我想邀請另一方當事者@Txkk君,請至此處討論,謝謝。--薏仁將🍀 2024年9月19日 (四) 02:44 (UTC)[回覆]
謝邀。各位(除了航站區)把我的意思都表達出來了,我就沒什麼可補充了的。--Txkk留言2024年9月20日 (五) 01:38 (UTC)[回覆]
任何來源添加到維基百科時,大部份來源會被Wayback Machine在一段時間內自動存檔,機械人InternetArchiveBot添加存檔網址,可視情況進行刪改。
不應強制用戶使用IABotManagementConsole或手動添加存檔網址。但如果有用戶在條目使用IABotManagementConsole或手動添加存檔網址,原則上嚴禁其他用戶復原或刪除相關編輯。

大家可以討論一下,結合了我、User:ShizhaoUser:HanTsî的觀點——航站區留言2024年9月19日 (四) 02:52 (UTC)[回覆]

我認為相關說明應該放在Wikipedia:列明來源(或者Wikipedia:外部連結)上(並且對應Wikipedia:失效連結),而不是將一本說明書打上格式指引的標籤。雖然明白提議者的想法。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:07 (UTC)[回覆]
PS.其實Wikipedia:失效連結裏面就說過,除了使用網頁存檔服務外,可以在引用模板摘錄出引述條目語句的原文,這樣也可以起到參考內容「存檔」的作用。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:14 (UTC)[回覆]
因為現階段討論的是,在有效期內提前存檔問題,閣下提及的是失效補救問題,好像方向不一樣啊--航站區留言2024年9月19日 (四) 04:12 (UTC)[回覆]
道理一樣,就是「插入外部連結來源作為參考資料時,應該建議同時做一次頁面存檔(然後手工加上存檔頁或者IABot添加)」,Wikipedia:失效連結看上去亡羊補牢,但同時也是防患未然。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:18 (UTC)[回覆]
@Cwek那閣下覺得,其實是不是可以把這個提議和上面一個提議合併?--航站區留言2024年9月19日 (四) 04:19 (UTC)[回覆]
嗯,其實大致就是上面的議題,添加上本操作手冊來配合操作。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:24 (UTC)[回覆]
不知道上面的提議者是否願意合併?--航站區留言2024年9月19日 (四) 04:28 (UTC)[回覆]
「大致就是上面的議題(提議對維基百科:列明來源的網頁部分新增關於存檔的要點),添加上本操作手冊來配合操作」,我認為說得足夠清晰了。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 04:45 (UTC)[回覆]

( π )題外話:頁面中的存檔連結也有保護私隱的效用。部分用戶在同時可以選擇的情況下仍然會優先訪問存檔連結。——暁月凜奈 (留言) 2024年9月19日 (四) 04:51 (UTC)[回覆]

這個有待商榷,比如機械人五年前的網頁存檔,但是這個網址到現在還能訪問,並且該網頁界面和五年前已經有很大變化了,這個時候訪問網頁存檔就沒有什麼意義了。我希望機械人能不能每隔一段時間把網頁存檔的未過期的網頁進行存檔更新,這樣不至於網頁存檔和網站隨着時間的流逝,差別越來越大--航站區留言2024年9月19日 (四) 04:59 (UTC)[回覆]
不認可。網站的內容可能會發生變化,以編者加入維基百科時的內容(當時的存檔)為準最為穩妥。--糯米花留言2024年9月19日 (四) 05:27 (UTC)[回覆]
那如果「外部連結」呢?比如一些作品的官網,比如五年前加入的網頁存檔和現在界面出現了很大差異,我覺得「外部連結」放置作品官網地方應該以截止他失效前最新狀態為主--航站區留言2024年9月19日 (四) 08:27 (UTC)[回覆]
我覺得外部連結通常不該加存檔連結,只是機械人經常加。--YFdyh000留言2024年9月19日 (四) 10:33 (UTC)[回覆]
IABot的管理界面支持URL的存檔狀態更新的。但看情況是否需要更新存檔頁面的數據,不強制為規範性條文。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 05:46 (UTC)[回覆]
機械人有個不智能的地方就是,一個條目存檔過了的連結,下次就不會再重新存檔了,我希望能設計成每隔一段時間機械人自動探測,把網頁存檔的未過期的網頁進行存檔更新,這樣不至於網頁存檔和網站隨着時間的流逝,差別越來越大--航站區留言2024年9月19日 (四) 08:30 (UTC)[回覆]
這應該是IAbot的問題,請跟IAbot的維護者反饋。——Sakamotosan路過圍觀 | 避免做作,免敬 2024年9月19日 (四) 11:30 (UTC)[回覆]
就事論事,鼓勵網頁存檔本就沒啥問題,也是落實本站可供查證的基本原則,我看不出來有什麼爭議可言?—— Eric Liu 創造は生命(留言留名學生會 2024年9月19日 (四) 06:23 (UTC)+1 [回覆]

本討論已關閉,請勿修改。如有任何意見,請在合適的討論頁提出,而非再次編輯本討論。