Feed Proxy

七月 21, 2006

在我把blog迁移到自己机器的WordPress之前,我使用的是W3Chinablog服务,使用的Feed服务是FeedBurner的.但是现在迁移到实验室的机器之后,没有办法使用FeedBurner了,因为这里的网络是校园网,国外没有办法访问到.
没有什么办法,只好退而求其次使用国内的FeedSky的服务,虽然支持中文好一些,但是和FeedBurner想必功能还是差了点,稳定性似乎也有些问题,不过也只能免强用了.这之后的问题是怎么处理FeedBurner上的这个feed呢?想了想还是决定指向FeedSky上面的这个feed,在做完这件事情之后突然发现,通过这一次relay,一经可以使得FeedBurner访问到我的feed信息了–使用FeedSky做一个代理.
除了我这种奇怪的需求之外,现在能想到的Feed Proxy的功能还很有限,FeedSky应该马上就会提供所谓的合烧功能,但是FeedBurner没有,这样就可以利用FeedSky的合烧mix几个Feed然后使用FeedBurner来发布:-).不过这种功能如果使用FeedDigest加上FeedBurner的话也可以实现,所以其他的功能要再发掘一下,谁有想法的请告诉我,any advice is appreciated.

China-pub RSS订阅

七月 15, 2006

今天上China-pub的时候,终于看到了China-pub提供了书籍查询和新书的RSS订阅服务.原来China-pub没有提供这一服务,对于跟踪新书很不方便,经常要登录到它的网站上去看,后来还用Feed43的服务自己定制了一个China-pub 15天内新书查询的RSS源,不过很不稳定,HTML页面解析模式经常有问题,现在有了官方的RSS源就简单多了,立即add to bloglines :-) .
还顺便去DearBook也看了看,原来那里也已经有RSS订阅了,而且还是使用了FeedSky,看样子比China-pub应该要更早提供这个服务,也更有经验一些.现在另外一个比较期待的RSS源就是Chinaren校友录了,虽然Suho提供了订阅服务,但是一定要用它那个奇怪的什么狗的Feed阅读器,我认为会使用Feed进行新闻浏览的人一定都对这种作法很反感的,而不会用的人肯定也不会因此改变自己的阅读习惯,还是每次登录然后浏览,所以这完全是吃力不讨好的动作,要开放就开放的彻底一些吧.

Voice Printer

七月 9, 2006

我本身对模式识别和自然语言处理了解不多,不过这几天冒出来的似乎都是和它们相关的一些想法。前段时间买了一台打印机,主要目的是想把要看的一些论文什么的打出来,这样在车上或者在路上或者在那些没有电脑的时候看起来方便一些,另外paper-based的文档看起来也习惯一些。也不知怎么晚上突然又想到,假如有一个Text to Speech的软件,把我要打的论文转成语音文件,比如mp3或者wav这些格式的,这样就可以直接用mp3播放器来听而不用看了,毕竟听读的速度比阅读的速度要快的多(当然,e文的话听力好像会有点要求:( )。也就是说如果可行的话,我需要买的应该就是mp3播放器而不是打印机了。
Wikipedia上面一下就找到了想到的东西,大致看了一遍以后决定用FreeTTS试试看,它是Sun公司下面的一个Media Lab的员工建立的项目,应该还是质量不错的。试用了一下,用起来还是满简单的(虽然在我的Ubuntu下面声音设备有些问题似乎),但是结果确不是很好。输出输入只有英语也还算了,关键声音质量实在不敢恭维,听起来就像电影里面的机器人的声音。不知道机器人发声是怎么样的过程呢?好像应该也是类似先软件编程robot.speak(”Hello World”),然后语音合成这样的方式吧,基本和这个FreeTTS的工作方式一样了,也就是说,你现在在电影中听到的机器人的声音,很可能现实中未来的机器人的声音就是这样的:),赶快想象一下Start War里面的金属机器人的声音吧。

Update:

最近想买一个iPod听podcast,突然发现网上有提供将text-based的feed转化为podcast的服务,其实和我上面的想法很一致,尤其是audiolicious,等我买好了再来用。

Google Translate API Hack

七月 7, 2006

今天在看RSS Clustering的文章时候想到了分词的问题,文章里面介绍的时候讲的是英文的clustering过程,统计词频对英文很简单,但是对于中文来说就没有容易了.中文的分词一直是个麻烦事情,涉及到很多NLP的东西,我完全不懂,不过不考虑中文就做英文内容的处理的话又不太甘心,毕竟自己的母语是中文.
要怎么样才能绕开这个障碍呢,文章是在公交车上面看的,办法也是在公交车上想出来的,用Google Translate来搞定!Google的Translate可以把各种(也不是各种吧,总之很多种)语言翻译成英语,里面用了N种统计学加计算机科学方面的知识,应该来说效果还不错,假如我可以调用Google Translate的API来把所有的中文都翻译成英文,中文的分词问题不就解决了吗?
回来以后立刻Google了一下Google Translate的API,还去它的developer社区找了一阵,发现原来Translate没有API可以用的,真是令人失望啊,看来Google在这方面还是不够开放.不过偶然发现了有人也想到了Google Translate的API访问问题,还找到了调用的办法,cool,下次找个时间一定要来实验一下.
其实Google Translate的API不开放真的满可惜的,像这个点子很不错的其实,不过不能调API的话就无从谈起了.

几个因素同时作用使得我有机会用上现在的这个dual monitor的配置,工作效率提高了不少(可以一边上网同时聊天:-) ),不过今天看到一篇文章,发现还可以大幅度提高Eclipse的使用效率.立刻试了了一下,感觉不错,调试程序的时候肯定方便很多,因为Eclispe的Debug的persipective总是感觉空间不够,screenshot两张做个纪念.

1. Dual Monitor Ubuntu

Dual Monitor Ubuntu

2. Two Eclipse Window in Dual Monitor Ubuntu

Two Eclipse Window in Dual Monitor Ubuntu

语音识别改卷系统

六月 18, 2006

昨天帮老师改了大半天图形学的考卷,上次也改过一次,不过这次的数量可多多了.前面批的时候脑子还轻松些,到了晚上统计分数就很痛苦了,神经紧绷的算了半天,虽然都是100以内的加减法,但是终归不敢马虎大意,可能一不小心成绩就差了一个档次了.改了一个多小时,忙到9点世界杯开始才搞定.
今天事后回想了一下整个改卷的过程,突然想到要是当时找一个语音识别的工具包,利用这个工具包写一个小型语音改卷计算器,只要人工念一下10,2,5.5,8,over,就自动计算出74.5这个成绩,又准确又省力,不是很酷?不过原来只知道IBM的一个ViaVoice有这种功能,MS Office也有,不过Licence好像会有问题.今早冲到实验室立马找了一下相关的工具包,发现有不少free的Speech Recognition的工具包(Speech Recognition Software).可惜考卷已经改好了,没有动力去做些实验看看好不好用了,暂且先记下一笔.不知道高考的改卷系统里面的统计分数是如何做的呢?

Update:

今天下午老师又在进行最后的登分活动了,把所有考卷的成绩登记到成绩表上,看他登的真是那个辛苦.所有的考卷都乱序,成绩表上也是乱序,老师的做法是遍历所有的考卷,在成绩表上查找对应的学号并进行登记,时间复杂度O(n^2),方法有问题,这里应该有一个考卷登分系统,对试卷按照学号进行预排序,然后对有序数组进行二分查找只需要O(logn),n份卷子的话就是O(nlogn).对于前面的排序算法的话,人工排序好像用快排或者堆排序都不方便,用插入排序比较现实,不过也变成O(n^2)了,想了想可以用两路归并排序,人工排的话相对简单而且只要O(nlogn),这样总的时间复杂度只要O(nlogn).300份卷子每份卷子登记需要10秒的话大概可以节省14000分钟.呵呵,好像估算误差满大的,纯属娱乐锻炼下脑子.

怎样做研究

六月 6, 2006

开始准备毕业论文了,不过根本没想好应该怎么来完成它.看了一些相关的指导性文章:

  1. 如何做研究?
  2. 如何做研究
  3. 做大事,成大业 YOU AND YOUR RESEARCH (节选)
  4. How to Write a Master’s Thesis in Computer Science
  5. How to Write a Greate Research Paper,非常好的一个slide,生动易懂
  6. Basic Steps in the Research Process,非常非常有用的网站,真希望能早几年看到

sourceforge再次被封

一月 29, 2006

已经对GFW彻底没有想法了,wikipedia被封我已经无法忍受了,现在连sourceforge都要赶尽杀绝!我已经开始想骂人了,这个渣渣的GFW简直没有任何民主性可言,某个网站的被封没有任何消息发布也没有任何理由解释。而且就我所知道的被封的原因,采取封锁网站的措施根本不解决任何问题。

蒋介石的”宁可错杀一千,也不放过一个“放在这里是再合适不过,这种政策简直愚蠢到了极点了,怎么会有人想出这种办法真是让我无法理解,难道连”防民之口,甚于防川“的古训都没有听说过吗?即使没有听说过这个,难道对大禹治水的故事都没有了解吗,小孩子都懂,堵是堵不住的!

在随便一个搜索引擎上搜索google+china,第一页上除了Google 之外,剩下的一半都是关于Google’s China Policy的链接。我怀疑全世界的Google就是www.google.cn下面有一个京ICP证xxx的这行小字。再这样发展下去Internet在中国就变成GWFnet了,人家好不容易从APARNET发展壮大,到了中国非但没有继续壮大,反而蜕化了,真是History goes as a circle。在我订阅的外国的blogsphere圈内(大多是技术相关的feed),很少讨论到政治相关的话题,我所看到的讨论政治相关的感觉主要就两点(Google sensors China users and microsoft msn space bans ”democracy” in China)。对中国的形象有什么好了?什么网络实名制,也亏那些人想得出来。互联网上没有人知道你是不是一条狗,既然大家都知道谁是谁了,那这里的互联网也就不能称其为互联网了。

Reference:

  1. 关于sourceforge.net被封事件
  2. 网站被封了怎么办?
  3. Typepad也被封了?
  4. blogsome是否遭到屏蔽?

Jetspeed心得随笔

一月 18, 2006

最近开始看Jetspeed2的相关资料,下面的心得随笔是在Javaworld Taiwan的论坛上面找到的资源,感觉写的很不错。对入门很有帮助。

另外,这里也有很多Jetspeed的资料可以参考,不过是法文的,可以通过Google Translate来进行翻译阅读。

免费Wiki资源

八月 21, 2005

这段时间想找一个Wiki来帮助大家协作编辑一些文档,试了好多个,都不是特别满意。大致列举如下,也为后人节省点时间。主要参考文章:

How To Start A Wiki

1. PeanutButterWiki

优点:界面很简洁,速度也很快。

缺点:用户权限管理过于简单,一个Wiki只能大家共享一个账号编辑。没有所见即所得的编辑器,必须使用特定的语法。

结论:个人使用的话是个不错的选择,不过可能要忍受一下编辑时的繁琐,不知道编辑多了会不会习惯。

2. Schtuff.com

优点:速度也很快,权限可以配置的很详细,界面也不错。

缺点:也没有所见即所得的编辑器,必须使用特定的语法。

结论:多人协作的话使用这个不错。

3. SeedWiki

优点:相比的话优点不多,不过知名度比较高,Google很容易就搜到了。

缺点:界面设计有些问题,很难搞清怎么创建页面。

结论:不推荐

4. Wikicities

看起来不错,不过注册以后一直没办法登录:(

5. wikihost.org

优点:界面做的很好,使用十分方便,有所见即所得的编辑器,就是编辑选项稍微简单了一些。

缺点:权限有问题,都是public的。

结论:个人使用还是不错的,要是有什么privacy的话就算了。

6. XWiki

优点:功能很多,提供了除了Wiki之外的许多功能,如Calendar等。界面也还算易用。

缺点:组织方式不是很好,更类似blog而不像一个一般的Wiki。另外编辑的入口不是很容易找。最大的缺点是–中文支持有些问题,显示没有问题,但是再次编辑的时候中文都转化为\uxxxxx的Unicode了。

结论:如果不使用中文的话是个不错的选择,附加的功能很不错。

Update:

今天看到Informit上面的一篇文章也是介绍Wiki Hosting的,在这里链一下。

Which Hosted Wiki is Right For You?

« 上一页下一页 »