最近开始着手一个Enterprise Information Portal的项目,我主要负责Portal里面的文档的元数据管理,想法是用RDF来对文档进行描述,然后应用到门户的文档分类浏览,检索等方面.
项目刚刚启动,已经碰到了许多问题了,苦于没人可以提供帮助.目前看到的问题主要有:
- 元数据到底在信息门户中可以有多大的应用,可以有什么应用,目前能够看到的应用也就是用于信息浏览与检索,看了一些Semantic Portal的例子,似乎也都是用于这些方面的,但让人觉得没有什么亮点.要说再和其他系统集成的话又感觉比较远了,迷惑中
- 元数据用RDF还是用OWL来描述比较好.现在Web上的很多元数据应用都是基于RDF的,像RSS,FOAF等等,基于OWL的好像没看到,但是RDF的表达能力又太弱了,也许现在还能够满足要求,要是以后有了新的需求的话再转到OWL就比较麻烦了.其实这又回到了第一个问题,到底有哪些应用是可以预期的?
- Encoding的问题.这是一个很实际的问题,用Protege编辑RDFS采用的是UTF-8编码,但是在Windows下用Jena解析的时候出错,中文全部不行正确解码,也不知道是Java的问题还是Jena的问题.