分类:'原创精选' 的所有文章

写blog为什么要加上引用链接?原创与盗版

link_network.gif

写文章/Blog的时候为什么要加上引用链接?

加上引用链接的好处
1. 增加内容的可信度:阅读者知道内容中的信息从哪里来的,就会觉得内容更加可靠
2. 增加阅读者的兴趣:授人以鱼不如授人以渔啊,阅读者不但得到了信息,而且知道了这些信息的来源。
 作者得到这些知识的途径也清清楚楚,这种技能本身也得到了传播,甚至比共享的知识本身更重要。
3. 增加内容发布者的权威性:如果发布者坚持这样做,阅读者总能在其文章里找到答案,自然而然就产生了权威性
4. 增加Google PR (长久的效果):这是前面那三个效果的副产品:可信度高的、权威的文章被引用的几率搞,自然很受搜索引擎的重视

说得泛一点儿,最大的好处是让互联网的知识更加结构化,因为:
1. 搜索引擎是很好用,但是,大家从最近的几件“人肉搜索”的事件就可以看出,人的归纳总结能力目前远高于电脑
2. 比如说,你搜到了一篇文章,关于华容道的,如果发现文章里面讲的不全:
2.1. 不加引用链接的内容,是一个点,且仅仅是一个点
  你发现了某篇文章讲到华容道的开局,但是作者当初是查的那些资料,一点都不知道,所以作者得到知识的途径并没有得到传播
2.2. 加了引用链接的内容,也是一个点,不过从这个点,可以找到一张网
  作者是怎么凝成这个点的,一目了然,更有甚者,一篇优秀的文章,只要追着引用链接一路走去,就能得到该领域90%以上的内容

怎么更好的加引用链接呢?下面是我总结的加上引用链接的原则
1. 这些时候最好加上引用链接:
1.1 引用自己曾经写过的文章
1.2 文章中引用别的文章的话,注明来源
1.3 转载别人的文章,一般原则是在最开始的地方标明来源,最好是文章的原始出处
1.4 提到别人的网名,最好能加上其网站、博客链接
1.5 文章中引用的资料链接
1.6 对文章内容有特殊意义的,比如文章讲的就是发芽网,那就加上链接吧
2. 搜索引擎可以轻易搜到的,可以不用加。对阅读者没有帮助的或者与内容关系度比较差的,可以不用加,比如文章的插图。
3. 加引用链接的时候越精确越好,能精确到文章,就不要只定位到网站
4. 引用链接也不是越多越好,满篇都是链接的文章不但重点不突出,阅读起来还容易让人感到非常的疲劳,长时间会产生反感

加引用链接的坏处:互联网变幻莫测,每天都有成千上万的网站挂掉,所以引用链接有时候会失效。但是这个说起来影响并不大。

BTW:
另外,关于最近的“番茄花园”事件,看到版权保护有所行动,很是觉得欣慰
但是我更希望看到加强对个人知识产权的保护,而不是只保护大公司
原创者的艰辛与无奈,盗版的轻松与猖狂,这是对原创者的直接打击,最终影响的是一个国家的创造力
特别是我从两年前开始关注一些原创网站,看到它们被压榨、被大公司抄袭以致无法生存的时候,就觉得特别的悲哀。

关于删帖和信息过滤

看到经常有博客留言上说删回复的问题,说是不够民主云云

我觉得这是一坨误解:在自己的blog上面删帖,和国家对互联网进行信息过滤是不一样的。

举个例子帮助理解:
有人在你门前拉了一坨屎,你是不是应该清理一下?在blog上面删帖就是如此。
但是,有一天,有人把你家门外加了一把锁,然后对你说:门前的那个花盆好像一坨屎哦,赶紧清理了吧,要不然你往后就别想出门了!这就是互联网信息过滤。

猜数字游戏,计算机求解,八步以内求解决策树

猜数字游戏

这个游戏的规则比较简单,一般两个人玩,一方出数字,一方猜。出数字的人要想好一个没有重复数字的4位数,不能让猜得人知道。猜的人就可以开始猜。每猜一个数字,出数者就要根据这个数字给出几A几B,其中A前面的数字表示位置正确的数的个数,而B前的数字表示数字正确而位置不对的数的个数。

如正确答案为5234,而猜的人猜5346,则是1A2B,其中有一个5的位置对了,记为1A,而3和4这两个数字对了,而位置没对,因此记为2B,合起来就是1A2B。

接着猜的人再根据出题者的几A几B继续猜,直到猜中为止。

次数限制
有的时候,这个游戏有猜测次数上的限制。根据计算机测算,这个游戏,如果以最严谨的计算,任何数字可以在7次之内猜出。而有些地方把次数限制为6次或更少,则会导致有些数可能猜不出来。而有些地方考虑到人的逻辑思维难以达到计算机的那么严谨,故设置为8次甚至10次。也有的没有次数上的限制。

前几天,突然想起来,研究生时候研究的猜数字程序求解问题,当时想做出一个完全决策树,根据这个树,任何数字都可以在8次以内求解。

解题思路很简单:

#1. 生成所有的四位不重复的0-9的数字组合的集合
#2. 随便找四个数字,比如0123
#3. 根据用户返回结果(xAyB),砍掉集合里面不符合结果的
#4. 根据现有数字组合,猜下一个,主要技术含量在这里:
#  a. 贪心算法,每次都找当前步骤里最优的
#  b. “最优”的定义:
#   b1. 选择一个组合
#   b2. 把这个组合和剩下的组合进行匹配,统计xAyB出现的次数,
#   __比如0A0B出现了10次,1A3B出现了0次等等
#   b3. 如果xAyB的所有可能出现的机会最为均等,那么这个选择的“区分度”就很大
#   __这个可以通过信息量理论进行衡量,也可以简化为通过“最小标准差”来衡量
#   b4. 遍历所有组合,找出“区分度”最大的
#5. 重复步骤3, 4,直到用户给出4A0B或者集合里面只剩下一个元素

首先在python-cn上面发起了关于如何快速生成所有数字组合的讨论
抛砖引玉,讨论的结果中居然有十多种方法,体现了不同的思路,具体的讨论参见:
函数性能:列出四个不重复数字(0-9)的所有组合

相关代码在这里:
生成四位不重复数字(0-9)的所有组合,比如8765, 9876, 0123
生成四位不重复数字(0-9)的所有组合

后来实现了上面所得解题思路,代码在这里:猜数字游戏的八步以内求解程序.

为了验证一定能在八步以内求解,我决定做个决策树生成程序,这个决策树的节点代表着每次猜测,树枝代表着xAyB这样的选择。
猜数字游戏8步以内的完全求解决策树生成程序

我实验过将这个决策树直接用于计算机求解,速度没的说,基本上就是8个以内的dict元素get操作和比较操作就能搞定。

参见:代码发芽网上所有标签(Tag) 为 猜数字 的文章

代码发芽网(Beta版,在线代码语法高亮)发布,欢迎测试、试用

在线代码语法高亮,支持多个主题,可直接复制粘贴高亮代码到各个网站、blog主流编辑器
已知的支持列表(不完全):
百度空间
csdn发帖
wordpress默认编辑器以及其主流编辑器
微软Office、Outlook
Google Gmail以及Google文档
163邮箱
等等等等,还有许多没有写在这里的

发芽网主页:http://www.fayaa.com/,目前只有“代码发芽网”一个子站点,将会发布更多
代码发芽网主页:http://www.fayaa.com/code/

基于python + Django + pygments,断断续续写了快要半年了,终于可以发布beta版了。



代码发芽网:
聚沙成塔,水滴石穿,积少成多,绳锯木断

您是否曾经有过这些经历
o 发现了很好的代码,保存后再也找不到?用邮件发一段代码,被抱怨说格式很乱?
o 发代码段给朋友时,没有彩色语法高亮?或者,复制粘贴以后却依然是白底黑字?

该站特色:

代码的版本管理与更新记录, 近百种编程语言的语法高亮, 看代码简单高效
动态切换语法高亮主题配色, 加色后的代码可以复制粘贴, 粘贴后依然高亮

点击此处进入代码发芽网

简单的使用实例:
打开这篇文章: http://www.fayaa.com/code/view/20/
然后选择代码,复制,在blog后台粘贴如下(行号可以在复制前去掉)

Python语言: Python - 人性化的时间(比如:两分钟以前)
#人性化的时间:2008-01-27 08:37:29
#发芽网使用此函数来显示人性化的时间:比如1分钟以前,三天前,等等
def time_span(ts):
   delta = datetime.now() - ts
   if delta.days >= 365:
       return '%d年前' % (delta.days / 365)
   elif delta.days >= 30:
       return '%d个月前' % (delta.days / 30)
   elif delta.days > 0:
       return '%d天前' % delta.days
   elif delta.seconds < 60:
       return "%d秒前" % delta.seconds
   elif delta.seconds < 60 * 60:
       return "%d分钟前" % (delta.seconds / 60)
   else:
       return "%d小时前" % (delta.seconds / 60 / 60)

2008-05-25更新:
修正了代码行数过长引起行号混乱的bug
隐藏了Feedback页面的IP地址的最后一位
缩小了代码的字体
搞定了用户页面最后一页时的异常

2008-05-27更新:
修正了用户注册时用户名重复的问题

2008-05-28更新:
调整了配色方案和代码发芽网首页
修正了一个站内搜索的问题
新增了支持复制粘贴到Discuz!论坛的功能。

2008-05-30更新:
调整了行号切换方案,参见:代码发芽网显示代码时做行号切换的javascript脚本
完善了用户信息编辑
对界面颜色进行了一些微调
添加了给作者发信的功能(附加验证码)

2008-06-25更新:
这段时间其实都有更新,主要内容如下:
1. 评论里面的代码缩进没问题了
2. 界面进行了更多的调整,让字体配色显得更加舒服
3. 支持受限制的Discuz论坛发帖了,虽然有限,但有总比没有好
4. 加入了直接复制代码的按钮
5. 用户可以编辑自己的用户信息了
6. 切换行号以后复制粘贴不会再把行号包括进来
7. 加入了“给用户发信”功能
8. 把表情图片改小了一些,看起来更加协调
9. 发临时贴不需要填标题了

windows命令行(Command Prompt / Console)字体设置

Windows命令行的字体一直让我不爽,只有两个选项,英文版还有个Lucida Console比较好看,切换到中文版以后,就只有很让人抓狂的Fixedsys和新宋体,唉,现在只要是可以输入的地方,哪有不让改字体的。

今天搜了一下,英文系统下,通过改注册表是可以做到的:
http://www.orablogs.com/duffblog/archives/001209.html
http://support.microsoft.com/kb/247815

但是中文系统下仍然不行,我先切换到英文系统,然后搞了几个快捷方式再切回来,试了几次总算成功了。

这里有张截图,其中用的是Bitstream Vera Sans Mono字体:
console_font_veramono.gif

为了以后方便,我做了一个包,按照说明安装之后重启机器,就可以在中英文系统上用了。
在这儿下载
http://www.2maomao.com/blog/wp-content/uploads/win_console_fonts.zip

压缩包里面包含了:
—— Lucida Console和Bitstream Vera Sans Mono字体
(参见我以前的文章:程序员最喜欢用的编程字体

—— 修改好的注册表项:console_font_setting.reg

—— 一些配置好字体的命令行快捷方式,包括Courier New / Lucida Console / Consolas / Bitstream Vera Sans Mono

使用方式
1. 下载,解压,先随便找个地方放一下
2. 导入注册表:双击console_font_setting.reg导入注册表
3. 安装字体:把ttf文件全部安装到c:\windows\font 目录下
4. 重启系统(必须),把四个快捷方式打开看看。

然后嘛,就看你自己做什么了,修改一下那些快捷方式里面的属性一般就够用了。

Update:
Fatalerr同学在随时随地进入命令行的评论中指出,要改变直接运行cmd.exe出来的窗口字体,需如下操作:
在注册表HKEY_CURRENT_USER\Console\%SystemRoot%_system32_cmd.exe下面增加以下String:
FaceName = Bitstream Vera Sans Mono
之后你再运行cmd.exe,字体就变成bitstream mono了!

« 上一页下一页 »