跳转到内容

维基百科:互助客栈/消息/存档/2012年7月

维基百科,自由的百科全书

中文维基文库近期被多个语言版本超越

如题。参考[1]。如法语版甚至已经超过英语版,成为第一语言版本。中文版原为第三,现在为第六,下方葡萄牙语版亦在加速。本人是技术盲,若各位能把之前百科上加条目的技术能力用于文库,实在是功德一件。现举数据库一例[2],欢迎各位高手参与协助。--Zhxy 519留言2012年6月5日 (二) 07:11 (UTC)

文库的来源都是任意格式的文本,不如百科来源的数据库的格式整齐好处理。Liangent留言 2012年6月5日 (二) 09:06 (UTC)
内地各地政府工作报告、五年计划及规划、各地政府命令和地方法规。可收的多着呢。--达师218372 2012年6月5日 (二) 12:20 (UTC)
正是。所以如果类似之前百科刷条目的方法能用在文库上就再好不过了。--Zhxy 519留言2012年6月5日 (二) 14:06 (UTC)
(猜的)内地很多发布的此类文档都是从Word直接复制到支持WYSIWYGCMS里面,格式乱得很。Liangent留言 2012年6月5日 (二) 14:36 (UTC)
内地可直接浏览的网站似乎文库已经包括了大部分,但很多都存在简繁转换问题。以前刷过的s:全唐文数据库是利用某网站的漏洞下下来的。
另一大扩充条目数来源是扩展已有条目。比如s:范文正公集,希望使用机器人将没有标点的五言/七言诗加上标点。手工与小程序加上标点的s:范文正公集/卷01可作为此类页面的范例。另外,这个文集的来源就是正体的,不存在简繁问题。
希望大学生维基人,可以利用校园可访问的数据库下载原文。(大量下载小心不要被抓到,抓到似乎是要罚款的。)
另外,我想重新提起一件似乎已经被否决过的事(具体记不清了)。一些计算机软件,包括加密的古文数据库(古文已经全部为公有领域),如果破解这些数据库,将文本公布在网上,应该不违法吧?

--王小朋友留言2012年6月6日 (三) 11:08 (UTC)


不是文库也要刷机器人吧…………——路过围观人士 2012年6月5日 (二) 15:42 (UTC)
可是一般的公文有关注度么……--铁铁的火大了留言2012年6月6日 (三) 14:33 (UTC)
人肉机器人曾经在中文维基文库制造大量错字条目,例如[3],已改正的少之又少。--Mewaqua 2012年6月11日 (一) 05:14 (UTC)
这就是王小朋友当年干的。而且他现在也在这样干。机器人如果把机器转换的文章贴上去,这就是胡闹。--Zhxy 519留言2012年6月13日 (三) 07:10 (UTC)
我也曾经改过一些王小朋友的错别字,古文最好用正体的来源,机械地简体转繁体,会出现很多错别字,必须人手校正,如果没有能力校正,那就最好不要乱来,看着这些白字连篇的文章,真是维基文库的败笔。--Quest for Truth留言2012年7月2日 (一) 20:05 (UTC)
维基搜索不支持简繁转换,我是在想,都是正体字便于搜索。另外一点,我敢说互联网上便于找到的古文的80%以上都已经在维基文库有了。我们下一步应该找数据库录入。数据库里都是正体原文。--王小朋友留言2012年7月8日 (日) 13:43 (UTC)

我觉得维基文库其实应该要做“版本学”的比较,这样光是一本古书,就会因为版本而产生很多条。而且这对学术研究会有帮助。--章·安德鲁留言2012年6月6日 (三) 16:19 (UTC)

我不反对。但是人手确实不够。如果说有机器人先导入,再由编辑者们校对、比较版本,这样会更好。--Zhxy 519留言2012年6月8日 (五) 16:48 (UTC)
我表示中立态度,现在最好吧维基百科搞好,借助姐妹计划的模板其他的维基项目也能带动起来,关键是百科。Qa003qa003留言2012年6月10日 (日) 08:32 (UTC)
我既然参与了文库项目,就谈不上顾此失彼,对我来讲没有主次,都是平等的。--Zhxy 519留言2012年6月12日 (二) 17:47 (UTC)
个人感觉,文库在处理古籍版本的问题(不是专指中文版),貌似没有一个比较统一的看法,有的同一个文章会建立不同版本,有的则是把不同版本都放在一起。我觉得用技术手段把同一个文章的不同版本放在一起是值得探索的尝试,即使是用作学习研究也很方便--百無一用是書生 () 2012年6月11日 (一) 02:34 (UTC)
其实现在一个文章建立不同版本相对主流吧。技术手段有就应该尝试,问题是我是技术盲。--Zhxy 519留言2012年6月12日 (二) 17:47 (UTC)
我记得法语版做过一个页面多个版本的尝试--百無一用是書生 () 2012年6月13日 (三) 01:14 (UTC)
建议推广https链接以便中国大陆用户参加--2011wp留言2012年6月16日 (六) 03:29 (UTC)
可能封锁整个维基媒体基金会的https。--王小朋友留言2012年6月22日 (五) 02:15 (UTC)

我给各位推荐一批数据库吧。

http://202.204.33.222/tpi_19/sysasp/include/index.asp
http://www.lib.pku.edu.cn/portal/index.jsp
http://www.dag.pku.edu.cn/
http://lib.tsinghua.edu.cn/dra/
http://lib.cuc.edu.cn/cuc/index.htm
http://lib.bfsu.edu.cn/

-- ──★──  2012年7月12日 (四) 14:29 (UTC)

再推荐一批

http://www.cfau.edu.cn/mainweb/xxzy/main.php
http://www.ccmusic.edu.cn/ccmusic/tushuguan/
http://lib.bda.edu.cn/
http://lib.nacta.edu.cn/
http://www.lib.shnu.edu.cn/
http://www.fudan.edu.cn/new_comservice/comservice.htm
http://www.lib.tongji.edu.cn/
http://www.sjtu.edu.cn/left/wbjd.htm
http://lib.shutcm.edu.cn/
http://www.lib.ecnu.edu.cn/
http://lib.shisu.edu.cn/
http://www.sta.edu.cn/list.aspx?nid=76
http://www.sus.edu.cn/web/tsg/index
http://www.lib.shu.edu.cn/
http://lib.sbs.edu.cn/
http://www.gymy.cn/jsp/quick-link/library.jsp

-- ──★──  2012年7月13日 (五) 09:59 (UTC)

问:删除自己建立的页面?

中文版和葡萄牙语版的条目数之间有一个“断层”

以条目数里程碑来看:

维基百科各语言条目里程碑
里程碑 语言(依到达里程碑先后排列)
4,000,000 英语(2012年7月13日)
3,000,000
2,000,000
1,500,000
1,000,000 德语(2009年12月17日);法语(2010年9月21日);荷兰语(2011年12月17日)
900,000 意大利语(2012年3月12日);波兰语(2012年6月4日);西班牙语(2012年6月29日)
800,000 俄语(2011年12月10日);日语(2012年4月3日)
700,000 葡萄牙语(2011年10月8日)
600,000
500,000 中文(2012年7月14日)
400,000 瑞典语(2011年6月19日);越南语(2012年4月11日)
300,000 加泰罗尼亚语(2010年12月21日);挪威语(2011年5月6日);乌克兰语(2011年7月7日);芬兰语(2012年6月26日)

来源:模板:维基百科各语言条目里程碑

首先,英文版几乎等于完全甩开其它语言,与德文版差距超过2,500,000条,倍数也超过2.5倍,这是因为它是全球性的语言。再来,从意大利文一直到葡萄牙文都很密集,唯独葡萄牙文和中文竟相差了二十多万条,这是怎么回事?111.248.20.39留言2012年7月15日 (日) 07:31 (UTC)

葡萄牙语有3亿人口--Dragoon16c留言2012年7月15日 (日) 08:18 (UTC)
书写上与西班牙语很接近。--Aoke1989留言2012年7月15日 (日) 08:25 (UTC)
因为欧洲语言刷条目比中文方便,很多条目直接照搬就是了,中文还得译成汉字:)--Tianyamm2留言2012年7月15日 (日) 09:40 (UTC)
而且西方国家维基社群编辑维百的积极性很高,他们当中的“专业户”也比较多,就像这样。-- ──★──  2012年7月15日 (日) 11:20 (UTC)

以社群大小和活跃度来说,中文和葡语(以及荷语版)是大致上同等级的。和这两版条目数的差异,主要就是差在机器人条目数量了。其他条目数比我们多的8个版本,那的确编辑社群比我们强大。ffaarr (talk) 2012年7月15日 (日) 12:00 (UTC)

图像过滤器

理事会决定撤回原先关于研发图像过滤器的决定(Jimbo投了反对票,果然)。wmf:Resolution: Personal Image Hiding Feature --Ben.MQ 2012年7月14日 (六) 23:28 (UTC)

从过去到现在的多语言条目增长图

这个连结:维基百科数据:条目计数 (正式)只做到2010年4月,有没有到现在的条目增长图?-Doraencyclopedia留言2012年7月17日 (二) 09:39 (UTC)

要很多个语言的。-Doraencyclopedia留言2012年7月17日 (二) 09:56 (UTC)
这个行吗--YFdyh000 2012年7月17日 (二) 14:14 (UTC)
还有吗?对了,找到一个东西了:条目增长(到2010年12月)-Doraencyclopedia留言2012年7月17日 (二) 15:47 (UTC)
这个图这个表格?--YFdyh000 2012年7月17日 (二) 16:11 (UTC)
表格好像有些怪怪的,比如说为什么sv(瑞典语)会是710K(71万)?-Doraencyclopedia留言2012年7月17日 (二) 16:35 (UTC)
是挺怪,不知道为什么。那看这个每月平均 每天新增条目数的表格吧。--YFdyh000 2012年7月17日 (二) 17:18 (UTC)
这表格不错,但是您给的条目数增长图好像都是对数图,有没有像我给的第一个连结那样的图?-Doraencyclopedia留言2012年7月18日 (三) 05:13 (UTC)
看到了类似的图(您给的),但是并没有很多个语言(只到意大利语)。-Doraencyclopedia留言2012年7月18日 (三) 05:50 (UTC)

BBC:走到台前来的维基百科男女写手们

译言:http://select.yeeyan.org/view/18312/302511 --Fanglongzong(╯3╰) 2012年7月18日 (三) 08:48 (UTC)

似乎是前一阵的story teller?-Mys 721tx(留言) 2012年7月18日 (三) 09:06 (UTC)

Musashi1945 用户正在条目破坏

看到了一位形式为IPv6的匿名用户

这个连结2001:DA8:215:C526:593:96FB:B308:ADFD--Doraencyclopedia留言2012年7月16日 (一) 07:30 (UTC)

一个多月前开始的。--MakecatTalkDC10 2012年7月16日 (一) 07:32 (UTC)
楼主火星了——今晚找错误去!留言/贡献2012年7月20日 (五) 11:42 (UTC)

俄语维基百科黑屏抗议

本来因为莫斯科新增了行政区要过去找资料,殊不知俄语维基百科今天(7月10日)像上次维基媒体集体抗议SOPA/PIPA般将所有页面换成抗议标语,Google翻译再整理一下:

今天7月10日国家杜马议会的听证会准备通过一项允许超法规的网络审查的资讯法案的修正案,而且其修正内容将会导致俄语维基百科的关闭。

-- 同舟留言) 2012年7月10日 (二)

01:13 (UTC)

囧rz...:英文维基百科开了先例啊……哪天中文维基百科会不会也推一个。--KOKUYO留言2012年7月10日 (二) 01:43 (UTC)
俄罗斯国家杜马法案89417-6——路过围观人士 2012年7月10日 (二) 02:44 (UTC)
(-)反对法案通过!我也本来打算去俄语维基找找下诺夫哥罗德缆车的更多信息,结果……刚去yandex了一下,发现连游戏论坛都有人在讨论此事…… --Алексеевский Скажите,пожалуйста! 2012年7月10日 (二) 02:55 (UTC)
这个黑屏比上次的强多了.....卍田卐JC1 2012年7月10日 (二) 07:22 (UTC)


该法案已经通过。俄罗斯议会上院通过互联网审查法律 --Zhxy 519留言2012年7月21日 (六) 08:28 (UTC)

Help decide about more than $10 million of Wikimedia donations in the coming year

(Apologies if this message isn't in your language. Please consider translating it)

Hi,

As many of you are aware, the Wikimedia Board of Trustees recently initiated important changes in the way that money is being distributed within the Wikimedia movement. As part of this, a new community-led "Funds Dissemination Committee" (FDC) is currently being set up. Already in 2012-13, its recommendations will guide the decisions about the distribution of over 10 million US dollars among the Foundation, chapters and other eligible entities.

Now, seven capable, knowledgeable and trustworthy community members are sought to volunteer on the initial Funds Dissemination Committee. It is expected to take up its work in September. In addition, a community member is sought to be the Ombudsperson for the FDC process. If you are interested in joining the committee, read the call for volunteers. Nominations are planned to close on August 15.

--Anasuya Sengupta, Director of Global Learning and Grantmaking, Wikimedia Foundation 2012年7月19日 (四) 20:31 (UTC)

Distributed via Global message delivery. (Wrong page? Fix here.)

好吧,我就看懂了“this message isn't in your language”这句……--铁铁的火大了留言2012年7月23日 (一) 07:00 (UTC)
机器翻译一下:--KOKUYO留言2012年7月23日 (一) 07:58 (UTC)

帮助决定未来的一年维基百科有超过1千万捐款的用途

(抱歉,如果这个消息是不是你所用的语言,请考虑自行将文章进行翻译)

嗨,正如许多人可能已经知道的,维基媒体基金会的资金负责者决定要在最近展开重大的改变,特别是针对有关维基媒体基金会将会就资金分配上作出动作。而作为计划的第一部分,目前正在设立一个全新且以社群为主导的“资金分配委员会”(FDC)。而在2012年和2013年年度,将会借由委员会来决定过1千万美元将会用在哪些计划的基础,这可能是维基媒体基金会、某个计划或者其他符合资格的机构

现在7名有能力、有智慧且值得信赖的社群成员,决定要开始征求志愿者加入刚建立的资金分配委员会,并预计委员会将在9月开始运作。此外,我们也需要社群成员来担任资金分配委员会的监督者。如果你有兴趣加入该委员会,请阅读我们对志愿者的呼吁,报名将计划在8月15日结束。

─维基媒体基金会全球教育与捐款应用主任阿那苏耶·森古普塔2012年8月19日(四)20时31分(UTC)

问:请问如何删除存盘里自己的留言记录 谢谢

问:我好心做坏事吗?

中文版wikiHow有望在今年9月上线

中文wikiHow(预览版)首页截图

同样基于MediaWiki的“怎么做”文章的外延数据库网站wikiHow已经全面展开了中文本地化和调试工作,预计将于今年9月左右正式上线。从预览版截图来看,目前中文版wikiHow界面均为简体中文,暂无简繁转换功能,预计之后开发者们可能会添加简繁转换插件。 ——张树人留言)- LGBT协会 2012年7月26日 (四) 05:33 (UTC)

修一下版权信息吧。Ben.MQ 2012年7月26日 (四) 08:41 (UTC)