转移博客到自己的主机

从2011年3月起,“语义噪声”就托管在Wordpress.com。对它的服务很满意,不过为了更大的自由度,决定把这个博客转移到我自己在Amazon EC2的主机上。

转移后有这样几个好处

  • 可以安装任意插件(plugins)
  • 可以和其他的组建更好地合作。比如现在的搜索是基于Elastic Search
  • 更好的中文环境支持,如Denglu评论
  • 数据自由度更好,比如视频,不需要先上传到Youtube上了
  • 数据更安全些

原来的域名blog.baojie.org不变。原博客baojiebaojie.wordpress.com会保留一段时间再关了

P.S. 2012-01-06 Elastic Search的分词有问题,默认把每一个汉字都作为一个词。换为paoding分词系统,加上自己的词典就好了。我用了medcl的ES RTF (ready to fly) https://github.com/medcl/elasticsearch-rtf/

read more

语义网相关文章:一年汇总

今天整理了一下过去一年写的和语义网相关的一些博文。分类如下

为什么最近写的少了?两个原因

  • 最近3个月太忙,基本没有时间写长文;各种短的火花,都写在微博上了
  • 条条框框很多,带着脚镣跳舞,还不如不写
里面有些文章是坑。很抱歉,估计一时半会是填不了了。

目录

  • 1 形而上学
    • 1.1 旧讨论贴
    • 1.2 旧英文贴
    • 1.3 反思
    • 1.4 产业评论
    • 1.5 新思维
    • 1.6 新思维2
  • 2 工程实践
    • 2.1 问答系统
    • 2.2 会议元数据
    • 2.3 其他应用
    • 2.4 语义网语言
  • 3 产业化
    • 3.1 语义网的公司
    • 3.2 创业
  • 4 个人研究
    • 4.1 描述逻辑
    • 4.2 Context
    • 4.3 域态逻辑
    • 4.4 语义信息论
    • 4.5 语义维基
    • 4.6 Web Science
    • 4.7 咬文嚼字
    • 4.8 胡思乱想
  • 5 杂谈
    • 5.1 入门与普及
    • 5.2 八卦
    • 5.3 活动
    • 5.4 其他

1 形而上学

旧讨论贴

究竟什么是Semantic Web?[2008] http://blog.baojie.org/2011/11/23/what-is-semantic-web-2 语义网: 检讨与展望(2008) http://blog.baojie.org/2011/04/06/semantic-web-2008/ read more

博客读者的地理分布

刚发现Wordpress现在可以看博客读者的地理分布了。下面是最近一个月(也许不到一个月)我的博客“语义噪声”的地区分布(地图在后)

最近一个月我基本没有在社交媒体上给我的博客做引用。主要的流量都是搜索引擎和个人主页上来的。

结论:主要的读者在美国。来自中国大陆的读者比例很低,可能是因为翻墙不方便。

United States FlagUnited States52%
China FlagChina10%
Taiwan, Province of China FlagTaiwan9%
Switzerland FlagSwitzerland7%
Germany FlagGermany6%
United Kingdom FlagUnited Kingdom5%
Netherlands FlagNetherlands3%
Hong Kong FlagHong Kong2%
Japan FlagJapan2%

(1%及以下的就略了)

要搞一个基于wiki和ontology的网站[2003]

Net.Weblog.20031202.txt

2003-12-02

I get tired of HTML and text in only natural language, I get tired of ftp, I also get tired of careful maintenance of my all online resources: Public BBS, Academic Notes, …. , and this homepage. It’s even hard for myself to find useful topics in the homepage, as it becomes bigger and bigger.

It’s time for semantic integration and some intelligence.

I’m trying to build a new site based on Semantic Web. Technologically, it’s a wiki system with the support of a controlled ontology, and some code work to convert old homepage into wiki pages. It will be ready probably in this month.

read more

系统维护

把博客关了两天,做了几件事

  • 测试了Wordpress的几个有趣的插件
  • 测试了Wordpress的访问控制与隐私保护功能
  • 研究了从RPI blog(SMW-based)到这里的自动转发问题,结论是还是手工转好了
  • 对搬到加州(2011-10-12)以来的文章做了进一步的分类整理

 

开始整理2008-2009的Blog

2008-2009的Blog在TW wiki上,大概有100篇的样子。这个我自己用Semantic MediaWiki搭的一个简单的blog系统,放在RPI Tetherless Wiki上。这个系统,到目前为止也只有我自己一个用户。做这样的eat your own dog food的尝试,我还做了不少,比如semantic email, semantic tasks。最后都不太成功,这里面有很多教训,以后再说。以后如果有机会,我会换个方法再试试。

以后逐步把我这个阶段的blog转到这个站来,也包括我在TW官方Blog上的英文blog。

read more

Switch to English

This is temporary. Chinese fonts are uninstalled from my computer, at least before I moved to the next position.

I always hated writing personal stuffs in English: my writing is slow, painful, broken, and mediocre.

It’s simply ugly.

But it’s still better than not writing at all.

So let it be.

本地复活了语义网研究论坛

这个论坛存在于2003-2007,原来的域名是semanticwww.com。和徐涵的XML论坛差不多一个时候搞起来的。但是我这个一直没有人气,我就是拿当笔记本用。后来遇到很讨厌的垃圾轰炸(伟哥广告之类),我也没时间管。等我毕业走人,也就关了。数据一直在我硬盘上。今天想找一点以前的文档,就把它找出来。掸掸尘土,还能用。

这个论坛是基于LeoBBS(雷傲论坛)的。基于Perl的程序。BTW,这个系统一点数据库都没用,全文件系统操作——我很喜欢这样,因为对我全透明,想搞点论坛本身的linked data啥的很容易。

read more

开始整理2004-2007的Blog

这个阶段的Blog发在我自己的一个wiki上(boole.cs.iastate.edu:9090/popeye)。自从我离开ISU,这个wiki就不在线了。今后一段时间,逐步整理这个阶段的文章。

这个阶段和学术有关的文章,主要在语义网研究论坛(boole.cs.iastate.edu)上,现在也不在线了。待有时间整理。

2001-2003的日记在个人主页,2008-2009的Blog在TW wiki,这里做个记号。

参《要搞一个基于wiki和ontology的网站[2003]

新博客:语义噪声

其实这是我第一个“正规的”的博客。我一直以为,博客无非就是网络日记。如果这样定义,那我的第一个博客始于2001年。之后陆陆续续用wiki建过两个,也在msn space或blogger上有零星的文章,都不稳定。现在计划把这所有的内容都在此重新整理一遍。无期限,也许1年,也许30年–如果30年后这个网站还存在 cap 我还存在。

据说现在wordpress.com还没有被墙。我嘴巴很大,难免哪天就会无意或者故意说一些犯忌的话。如果被误伤或者咎由自取,我会开一个阉割过的新浪版本。韩寒嘴巴比我大,现在他的博客还存在着,所以我的这种担心或许是多余的。不过真理部的行事,一贯的高深莫测,比如我一直就不明白为什么baojie.org是被墙的。

read more