niyue

Voice Printer

In idea on July 9, 2006 at 10:07 PM

我本身对模式识别和自然语言处理了解不多,不过这几天冒出来的似乎都是和它们相关的一些想法。前段时间买了一台打印机,主要目的是想把要看的一些论文什么的打出来,这样在车上或者在路上或者在那些没有电脑的时候看起来方便一些,另外paper-based的文档看起来也习惯一些。也不知怎么晚上突然又想到,假如有一个Text to Speech的软件,把我要打的论文转成语音文件,比如mp3或者wav这些格式的,这样就可以直接用mp3播放器来听而不用看了,毕竟听读的速度比阅读的速度要快的多(当然,e文的话听力好像会有点要求:( )。也就是说如果可行的话,我需要买的应该就是mp3播放器而不是打印机了。
Wikipedia上面一下就找到了想到的东西,大致看了一遍以后决定用FreeTTS试试看,它是Sun公司下面的一个Media Lab的员工建立的项目,应该还是质量不错的。试用了一下,用起来还是满简单的(虽然在我的Ubuntu下面声音设备有些问题似乎),但是结果确不是很好。输出输入只有英语也还算了,关键声音质量实在不敢恭维,听起来就像电影里面的机器人的声音。不知道机器人发声是怎么样的过程呢?好像应该也是类似先软件编程robot.speak(“Hello World”),然后语音合成这样的方式吧,基本和这个FreeTTS的工作方式一样了,也就是说,你现在在电影中听到的机器人的声音,很可能现实中未来的机器人的声音就是这样的:),赶快想象一下Start War里面的金属机器人的声音吧。

Update:

最近想买一个iPod听podcast,突然发现网上有提供将text-based的feed转化为podcast的服务,其实和我上面的想法很一致,尤其是audiolicious,等我买好了再来用。

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: