How to explore an ontology using SPARQL 如何浏览一个本体

This article gives some typical SPARQL queries I used for getting familiar with an ontology which is only accessible by a querying endpoint.

1. Classes used

SELECT count(?x) ?type
WHERE{
 ?x a ?type.
}
GROUP BY ?type

2. OWL Classes

Sometime also need to find instances of rdfs:Class

SELECT ?x
WHERE{
 ?x a owl:Class .
}LIMIT 100

Instance counting

SELECT count(?y) ?x
WHERE{
 ?x a owl:Class .
 ?y a ?x .
}
GROUP BY ?x

3. Class Hierarchy

SELECT ?s ?o
WHERE{
 ?s rdfs:subClassOf ?o .
}
LIMIT 100

4. Properties used

read more

真的是大历史吗?(3)黄就不该涉足中国现代史 [2004]

参《真的是大历史吗?》(2002)

2004-12-02

有关讨论摘要(有关论述的版权归各自原作者所有)

baojie (西瓜大丸子汤) Thu Dec 2 01:28:50 2004

大家正是理解了”数目字管理”理论不太灵, 才对黄老加以批评

我看黄的例子从反面验证了专业分工的必要性. 他要是专注搞明代财政史, 说不定成果更大, 可证性更好点. 当然, 也就不会象现在这样有名.

cozofu (但为君故) Thu Dec 2 01:30:42 2004

wow, another claim. how can you prove it? You’ve proved nothing so far, and from your posts, I can’t see deep understanding of his theory.

read more

真的是大历史吗?(2) 黄仁宇的数目字管理说是不是教条? [2004]

参《真的是大历史吗?》(2002)

2004-12-02

讨论页:[http://boole.cs.iastate.edu/isubbs/view.cgi?forum=38&topic=119]

有关讨论摘要(有关论述的版权归各自原作者所有)

cozofu (但为君故), Dec 1 23:15:55 2004

你还是没完全明白黄的逻辑. 黄的逻辑是这样的. 国民党, 明朝, 宋朝, 其共同之处在于社会发展已经相当复杂, 城市的影响越来越大, 然而传统政治体制却无法适应这种发展的需要. 因此只能做一个粗扩的管理. 社会的中间阶层没有发育出来, 上层的中央政府经常要直接面对万民, 于是精确的管理变的不可能, 他们只好用道德来约束. 而这种约束在中国的地位没有挑战的时候是有一定效果的. 但是鸦片战争之后, 中国不具备竞争上的优势, 于是就产生灾难性的后果. 而之所以北方游牧民族能够成功, 正是因为他们采取一种均一的组织形式, 避免或者说绕过复杂的上层问题, 以取得效率.

read more

几则农村的故事

最近听说一些农村的故事,真伪皆不可考。

一个人得了重病,自知不治,叫他老婆去买安眠药,吃了自杀。等他睡了,他老婆便以为他死了,叫孩子等,来装殓了埋掉。埋了回来别人奇怪,这个人还有热气。其实装殓的时候还有心跳,算是活埋。这种事在农村,现在还很寻常,没人管。

又有一家,大约二十年前,连生了四个孩子,都是女孩。那妇人便动恶心,要除去最小的那个。那小女儿已三岁,乃是亲生。妇人家里有口缸,将那孩子扔了进去,盖上缸盖。那孩子要求生,竟挣扎出来。妇人竟又扔了一回,那孩子哀求道:“妈妈不要杀我,我长大了养你”。妇人把缸盖上压上重物,这次孩子终于死了。俄而有妯娌来串门,妇人在家大哭,说自己女儿跌缸里淹死了。男人回家,乃把孩子收了,山上埋掉。至于男人是否是同谋,乡传野语并没有说。后来这家又生产,竟是一对双胞胎女儿。乡里同仁叹息,不在他们狠心,而在他们被报应,又添两个女儿。

read more

妞15个月(2011-05)

最近的一些大事

  • 上学了(托儿所),基本没有哭。感冒三个星期。
  • 会爬楼梯
  • 试图自己穿鞋,偶尔会成功。
  • 走路很稳了,很少摔跤。
  • 开始吃和大人一样的饭,不再只吃稀饭了。
  • 除了bye bye,还会和人hi
  • 玩把东西掏出来再放进去的游戏:比如从盒子里掏尿布,从书架上掏书,从鞋架上掏鞋。

从挖地雷到分布式文件存储(删去编码)

erasure channel一般翻译为删去信道或消去信道,Erasure code一般翻译为删去编码或者存疑编码。

(1)删去信道

删去信道是会以一定概率丢失比特或者信包packet的信道。例如二进删去信道Binary erasure channel。输入信号符号是{0,1},输出符号是{0,1,e},e代表信号丢失。对下图BEC,信道容量是1-pe

信道容量的证明:以1-p的概率,传一次就成功。如不成功,再传一次成功,概率为p(1-p),也就是用2次。这样,要以极小出错概率传输,需要传

read more

为什么要区分Context和一般知识

为什么要把context(域)和非context知识分开。比如temporal context, 我们可以写成ist(C(x), t),也可以写成C(x,t)。为什么不使用后一种方式?

用context建模有如下好处

1)用context建模可扩展性好。比如原来我们的知识库里有C1(x)… C100(x),现在要加一个时间维度,那要对所有的谓词都修改arity为2。如果以后又有新的context维度,又要修改。比如我们在Wikipedia上做编辑,编辑的revision log并不会加入页面本身作为正文——这些log就是各个版本的context。

read more

量子信息论和语义信息论

这两者之间其实有很近的关系

一个量子比特(qubit)是多个纯态(pure state)的叠加。例如|s>= 0.707 |0> + 0.707 |1> 就是说 |s>以概率0.707*0.707=0.5为|0>,以概率0.5为|0> 。也就是,如果进行100次测量,那近似 50次得到|0>。

在语义信息论中,一个消息,也即是一个逻辑的表达式,代表多个模型。每个模型有自己出现的概率。例如,假如模型的集合是一个一个的人,其中20%是小孩,20%是老人。那消息“小孩或老人”的逻辑概率是40%,其中一半的可能是小孩,另一半是老人。

read more

微日记 [2011-05-21 to 2011-05-25 新浪微博]

[2011-05-25]
这个是不是腐败不好说,应该和与他们背景相似的人的投资回报做比较才能确定。但是美国的权钱交易方法很多,完全合法——这也就是为什么有部长当的好好的突然辞职,转天就拿到一个年薪百万的工作。你想想,这些人去私企,收入>10倍。难道所有这些官员都是雷锋?一个两个雷锋有可能,都是雷锋那是yy
转发@新浪美股 的微博: 【美国政客都是选股高手】4名学者对约300名众议员1985-2001年的1.6万笔股票交易进行分析,发现他们的回报率“高得离谱”,按照他们的交易所编制的投资组合每年跑赢大盘大约6%。5年前该研究团队发现参议员更厉害,跑赢大盘大约10%。1994年,希拉里曾被披露早年交易期货获利100倍。

read more

微日记 [2011-05-16 to 2011-05-20 新浪微博]

[2011-05-20]
你说把人家学位论文拿来卖钱的人是不是该被tjjtds? http://t.cn/heQTvx

[2011-05-20]
为什么打喷嚏是天生就会的,而擤鼻涕和吐痰就要学呢?(妞的感冒还没好,现在还是个鼻涕虫)

[2011-05-20]
看了一篇讨论雕版印刷和活字印刷优劣的文章。对中文,活字印刷的问题是人力需求大,而且要求工人素质高,还不如雕版。前些日子看中国通史元明部分的印刷术,根据对古书的统计,雕版从来都是多数。联想到语义网vs机器学习方法的优劣,觉得语义网也面临同样的问题。工业就是要实用http://t.cn/hel3hG

read more

微日记 [2011-05-06 to 2011-05-15 新浪微博]

[2011-05-15]
家里老人在看《王贵与安娜》我扫了一眼,看安娜教训4岁的儿子,不许练弹弓,要好好学习,学会数数到20。小家伙不服气,说我要不练,谁谁就超过我了;还说,某弹弓准,某弹弓远。我就说,这啥教育理念,有这么有上进心,智商兼情商高的儿子,我高兴还来不及。可叹我自己,30+了还天天被催要好好学习。

[2011-05-15]
嗯,是应该让卢浮宫也转一点东西到故宫来(台北也成),法国的贼比中国的牛逼多了。BTW,我更爱说不要把所有的篮子扣在一个鸡蛋上。
转发@张雷_天涯倦客 的微博: 北京故宫管理方如此的漫不经心再次说明不要把所有鸡蛋放在一个篮子里。有个台北故宫真的是焉知非福啊。http://t.cn/heqzJH

read more

微日记 [2011-05-05 to 2011-05-10 新浪微博]

[2011-05-10]
现在有红十字,红新月还有红水晶。中国又不是基督教国家,搞什么红十字不伦不类。我看,搞一个“红中”最好,最中国。

[2011-05-10]
“韩寒是想当鲁迅没当成,却成了小尼姑,瞅着满世界都是阿Q想摸她”- 精辟

[2011-05-10]
房子本来是一种消费。鼓励没有承担能力的去买房,是对社会的不负责任,最后就是次贷危机。不过上面的计算,其实很不靠谱,真实回报率已经包括贬值率了,而且遗漏了州税的折扣,所以总回报率应该还是正的。贷款利息也不是可以线性加减的。
转发@创业家杂志 的微博: 【美国房地产35年回报率为零】根据《费城联储商业评论》最新研究,尽管全美房价指数从1975-2009年的真实回报率为1.3%,但如果假定年均贬值率2.5%、房产税1.5%、抵押贷款利率7%和边际所得税率25%,美国房地产过去30年经调整的真实回报率实际为负值:(1.3-2.5-1.5+0.25(7+1.5))=-0.575。(via@新浪财经)

read more

微日记 [2011-05-01 to 2011-05-05 新浪微博]

[2011-05-05]

niu
转发@李蒙记者 的微博: 【奥威尔和赫胥黎所担心的】这组漫画太牛了!http://www.douban.com/note/143622946/

[2011-05-05]
语义通信这篇文章被录用了 http://t.cn/hgoi7j

[2011-05-05]
我对“微信贷”深表怀疑。孟加拉的实践表明,这个东西也会逼死人命。说穿了,这个东西就是高利率高风险贷款,通过小额来分散风险。银行还是要赚钱的。在中国农村会不会成为变相的高利贷,难讲。
转发@创业家杂志 的微博: 【村里来的年轻人】农村金融的活力正亟待释放,据统计,农村贷款金额26.7亿元。”微信贷”星星之火可以燎原,这些脚踏实地的理想主义者正深入麦田,耐心运作着单笔5000元贷款业务。一群创业版的“麦田守望者”,一种现代版的“乡村实验”,一个社会企业版的”乡土中国”http://t.cn/hgJ2tb

read more

微日记 [2011-04-21 to 2011-04-30 新浪微博]

[2011-04-30]
转发@黑色幽默精选 的微博: 我同事告诉我,现在相亲女方不再SB地直接问男方是否有房有车,而是问:你们小区停车费多少钱一个月?我一听,震精了。这问题太TM有艺术性了!不得不服啊!

[2011-04-30]
如果把导演们都象狗狗一样给喀嚓了,少花点潜规则的时间,会不会有助于拍出《史记》这类经典? //@包凡:转发微博

[2011-04-30]
其实英法要想赢利比亚很容易,让意大利派兵帮卡扎菲就可以了。意大利现在看在北约的哥们义气,没有和英法联手。可是局势再这么下去,意大利再不出手对英法开战就不够意思了。送十万意大利人给卡扎菲,吃都能把他吃死。

read more

微日记 [2011-04-11 to 2011-04-20 新浪微博]

[2011-04-19]
我老婆说我有毛少将谈民办教师的谈话风格,我想,这个呢,是不是呢…这个,大概,我总结一下…可能不是冤枉我,…啊,那个,我引申一下,大概是表扬的意思。

[2011-04-18]
我的意大利印象 http://t.cn/hrD9hG
转发@npubird 的微博: 意大利人办事就是拖!拖!拖!!不知道别人接触的意大利人是不是也有这样的感受!

[2011-04-14]
抬你杠催如星火 刚刚又开完一个Telcon(抬你杠),也就是电话会议。 我本来想说,“我最痛恨抬你杠”。不过转念一想,态度,态度决定一切,就改成:“我觉得抬你杠是一种有趣的人类活动”。http://t.cn/hrXQOf

read more

微日记 [2011-03-21 to 2011-04-09 新浪微博]

[2011-03-21]
妞很喜欢喂我,给她一个桔子半个进我肚子里了,很感动,特别是当她很有诚意地从自己嘴巴里掏出来,努力塞给我的时候

[2011-03-30]
分清因果性和相关性,光是统计还不够,还得来点Computational Learning Theory //@潘越_:为了识破虚假信息,应该把统计学纳入义务教育 // @科学松鼠会@松鼠云无心 :#养生大师速成培训#:某种动物从来不得X病,这种动物吃A食物比较多,所以A食物治疗X病有奇效。(把“没听说老鼠得癌症”等同于“老鼠不会得癌症”,粉丝们不会追究这二者区别的。) @Ent_evo :还有“某种动物从来不得Y病,所以吃这种动物对Y有奇效”

read more

柳梢青 晓来天气重温[1994]

柳梢青

1994-01-12

檐语惊襟,合衿暗索,若梦如真。
慵凝一晌,安排难续,半掩深门。

晓来天气重温,三两点、细惹靴痕。
雾妨晨城,灯萦镜道,雨打行人。

P.S. 2011-05-25 前几天一直下雨。听雨声,又想做酸腐文人。好在我现在腹中只有脂肪,没有酸。17年前的这首词,却也写了现在的心情。

读了这么多年书,回头一看,怅怅然如一梦。似乎所学都无用,似乎每门功课都不懂,越来越惶惶然觉得要被历史淘汰,却无处着力。贪图安逸,畏惧变化,效率低下,疲于奔命。

read more

2005年中国GDP[2006]

【Net.Weblog.20060124】

2006-01-24

很高兴, 2005年中国GDP 2.26万亿美元, 人均$1700

在美国的这五年, 中国发展真的很快. 虽然问题很多, 但是无论如何是过去百年中最好的时光.

最近看美国进步运动史, 深感中国现阶段问题大多都是美国当年遇到过的问题. 我相信中国也会出现一批时代的代表, 来全方位的推动社会改革(不仅是经济改革和政治), 真正建立一个世界强国.

参考于美国的经验, 中国最需要解决的是以下几个问题

read more

电影是劳动人民的鸦片[2005]

【Net.Weblog.20050801】

2005-08-01

票房最棒的电影, 大都是童话, 神话, 科幻, 灾难. 看IMDB票房排名(2005年8月1日)前20名, 只有阿甘正传是现实题材, 其他都是幻想.

借用马克思的一句话, 电影是劳动人民的鸦片.

1. 	Titanic (1997) 	$1,835,300,000
2. 	The Lord of the Rings: The Return of the King (2003) 	$1,129,219,252
3. 	Harry Potter and the Sorcerer's Stone (2001) 	$968,600,000
4. 	Star Wars: Episode I - The Phantom Menace (1999) 	$922,379,000
5. 	The Lord of the Rings: The Two Towers (2002) 	$921,600,000
6. 	Jurassic Park (1993) 	$919,700,000
7. 	Shrek 2 (2004) 	$880,871,036
8. 	Harry Potter and the Chamber of Secrets (2002) 	$866,300,000
9. 	Finding Nemo (2003) 	$865,000,000
10. 	The Lord of the Rings: The Fellowship of the Ring (2001) 	$860,700,000
11. 	Independence Day (1996) 	$811,200,000
12. 	Spider-Man (2002) 	$806,700,000
13. 	Star Wars (1977) 	$797,900,000
14. 	Star Wars: Episode III - Revenge of the Sith (2005) 	$790,200,000
15. 	Harry Potter and the Prisoner of Azkaban (2004) 	$789,458,727
16. 	Spider-Man 2 (2004) 	$783,577,893
17. 	The Lion King (1994) 	$783,400,000
18. 	E.T. the Extra-Terrestrial (1982) 	$756,700,000
19. 	The Matrix Reloaded (2003) 	$735,600,000
20. 	Forrest Gump (1994) 	$679,400,000
read more