niyue

Archive for the ‘other’ Category

Google Search History

In other on 12月 5, 2007 at 12:16 上午

心血来潮看了下我的gmail的帐号的search history.

这是个注册没多久的帐号,2007年6月才开始用的,到现在大概半年不到的时间吧.1515次搜索,平均下来大概每天Google 10次,用的最多的自然是Web Search,其次是Map Search,除此之外的Image, News, Video搜索都很少用.还有些如Product, Blog和Books搜索都是从来没用过.

感觉垂直领域的搜索使用的机会相对少很多,尤其如果这个垂直领域和Web上的信息还有交叉的话.比如Blog这种垂直领域搜索,实在感觉不出和Web搜索上面找到的Blog内容有什么很大不同,真有人有这种需求吗?

很神奇的是我发现我居然还点过好几次sponsor links(这种一般都被我认为是厌恶的垃圾广告链接,拒而远之的).其中两次是想下载软件,分别点了Google Pisaca(名字起的太差,根本记不住, Pisaca, Picasa…只能靠搜)和Adobe Reader的sponsor link.还有4次都是我想购买商品的时候搜索商品信息时点的链接,iPod, Macbook, laptop cooling pad和眼镜.难怪Google广告生意这么好啊.

医生这行

In other on 10月 13, 2007 at 10:58 下午

自己编的一个小故事:

话说有一家企业有些业务上的需求需要使用软件系统来解决,于是邀请了一家软件咨询公司来做咨询分析.这一咨询公司开展了一段时间的咨询活动之后,告诉这一企业:我也不清楚你们需要上什么样的系统才能满足你们的业务需求,不如这样吧,你们先上个SAP看看是不是可以解决问题.我估计可能不行解决,不过先试试看吧.当然咨询费用和实施费用还是要全额付清的.如果不行解决问题的话,你可以再来找我做一个咨询,我帮你再想办法.

真实的故事:

今天带女朋友去医院看病,医生看了半天,在病历上写了:发热,原因待查.开了点药,要打一针,然后说去吊盐水,顺便还补上一句:先试试看,我估计不管用.付了钱后打针加吊盐水,回来又吃了药,果然没用,到了晚上继续发烧到39度.

医生这行真是太赖了~

购买Mac

In other on 9月 12, 2007 at 12:54 上午

最近正在筹划如何比较合算的购买一台Mac,购买Apple的东西的方法比较多,在线购买或者线下购买,Apple自己的商店或者第三方的商店,都有一些不同的讲究。

使用Education Discount实际购买者现身说法:

结论就是:
对于Apple Online Store上面使用Education Discount进行购买的话,Apple可能会进行随机的检查。而且照回复的情况来看,随机检查的概率还是比较高的。如果被发现是欺骗的话,会要求退款。如果不理会这一退款请求的话,可能会收到律师信…因为省的不多,100刀也就800RMB不到,比较起来还是不值得冒这个险。如果你在美国有认识学生的话就很好办了,直接叫其帮忙代买一下,这个似乎完全没有什么问题。而且如果是能够通过学校内的Apple Store进行购买的话,可能会更加便宜。

如果你是在Apple的零售店里面购买的话,则完全看你人品好不好,碰到个好的服务员的话就ok了…

EMC Acquisitions Visualization

In other on 6月 23, 2007 at 5:48 下午

EMC acquired lots of companies during these years. And one picture is worth thousands of words.

EMC Acquisition Visualization

And I got the inspiration from this article, a visualization about Microsoft’s evolution, to create such a timeline to visualize EMC’s evolution in the past 10 years.

SIMILE Timeline is used to visualize the data. After some searching, I found something similar(In China, you have to work around GWF to view this page), which incorprates Google, Microsoft, Yahoo’s acquisitions.

时间管理

In other on 11月 4, 2006 at 4:59 下午

上帝有一点对每个人都很公平–每个人每天都是24小时.时间每个人都有,但是还是有很多事情”没有”时间做.
我的wish list已经很长了:

  • 很认真的写论文,用latex
  • 把我想做的reader做好
  • 带领team做一个成功的项目
  • 旅游
  • 其他的一大堆

好像都没有时间做,是我的时间管理上出了什么问题,还是其他的原因?Google一下time management,有一堆的文章教授你如何进行时间管理的,原来也看过不少,但是很难执行,没有看到什么效果,最后一直忙于其他的琐事(当然,有的也不是,比如找工作),但是想做的事情确一直没有开始,真是要好好反省一下了.

Update:

让你的个人效率翻三倍

翻译失真

In other on 10月 1, 2006 at 11:09 下午

本人很不喜欢看国内的人写的技术书籍,究其原因,主要是一般国内的技术书籍很少有写的好的,基本都是拿来主义拼出来的一本书,没有什么主题和思想可言.不过看e文毕竟没有看中文方便,速度快,所以我买的最多的看的最多的书其实是外国作家写的书,经由国内作者翻译的翻译本.这些书的内容虽好,但是有的书籍翻译质量实在太差如Joel说软件,翻译出来的简直不是一本书,对这种书是彻底不报希望了,但是有些书翻译的质量还是很高的,但是其中存在一些细小的失真,可谓是白璧微暇.

像潘彦翻译的这本算法设计与分析基础就是一本翻译的比较好的书,内容基本没有什么错误,理解也比较到位,看起来很舒服.但是有一个细节–很多国内的出版商都不注意书籍的细节–没有传递给读者,请大家比较一下翻译版和原版书籍的封面:

翻译版:

原版:

看出点什么来了吗?原版的作者肯定是花了很大的心思设计这个封面的,在这个封面中,包括了算法入门的许多问题:过河问题,树,称天平,汉诺塔等(还有没我没看出来的?),很有点玩一个游戏的隐藏关卡的意思,但是在翻译版里面的封面就完全看不出来了,彻底流失了这部分的信息,不能不说这是一个很遗憾的地方.其实外国的很多作者在封面,脚注或者索引等细节处都是花了很多功夫的,但是到了国内出版的时候这些地方往往被认为是一个可有可无的部分然后就遗弃了,原作者的心血都白花了,确实很可惜.
我在这里的建议是,对于这些部分,just copy and paste:-),大家可以看得出下面这本书的封面有哪些AI stuff吗?

编码问题释疑

In otherprogramming on 9月 23, 2006 at 9:08 下午

生活在中国的程序员恐怕没有不会碰到这个问题的–编码问题. unicode, utf-8, GBK, charset, encoding, code page这么一大堆术语加缩写,让人一看到就头晕,根本搞不清哪个是哪个. 各种各样的地方都会出现编码问题–数据库, JSP, mp3标签等等等等,不一而足. 我自己就花了不少时间解决编码的问题(还曾经写了一个很粗糙的Firefox的扩展来修正网页的编码),但面对这么多的术语,再加上平时解决问题时间有限,一般都是找了个方法摆脱了乱码问题之后就再也不想去看这个玩意了。今天本来是想比较一下python和ruby两个语言的,结果从ruby对unicode的支持问题开始,又回到了编码问题上来,终于决定把这些东西搞个清楚。

不过相关术语是在太多了,我建议大家先去看Unicode的词汇表,有什么疑问的词就可以在这个表里面search一下,一般可以立即得到一个清晰准确的解释,我主要结合wikipedia上对unicode的注释(unaccessible for some well-known reason)和unicode的这个词汇表讲几个最常碰到的词语和几个最大的疑惑。
confusing question:
Q: 编码到底是怎么一回事(-_-超级大问题,就解决这一个了决定)?
A: 历史上,编码问题最初是不存在的或者说不是什么大问题(很明显的,计算机发展初期只有英文使用者),字符集和字符编码是不区分的,统一用charset这个词来表示,同时兼了这两个词的含义.到了现代,编码这个问题被解耦成为几个部分:

1. what characters are available
2. their numbering
3. how those numbers are encoded as a series of “code units”
4. how those units are encoded as a stream of octets (bytes)

部分1指的就是字符集,表示可用的所有的字符,包括数字,字母,标点,汉字等等.
部分2指的是编码字符集(这里用英文可能更准确一些coded character set,被编码了的字符集),也即部分1中的每个字符会映射到一个或多个数字或者其他符号,由这些符号来代表部分1中的字符.
部分3和4指的是如何将2中映射得到的数字最终表示为计算机可以识别的二进制串(3,4拆分为两步的主要原因于计算机对字节流的解释有关big-endian or little-endian,不考虑的话应该可以合并).
从这四个部分可以看出,解决编码问题需要定义字符集,定义映射方案,定义编码方案这几个重要步骤.

Q: Unicode又是怎么一回事,它和utf-8有什么关系?
A: Unicode和另外一个与之并列的标准ISO 10646共同组成了一个上面提到的解决编码问题的解决方案,它不是四个部分中的任何一个,而是这四个部分各自解决方案的一个组合.其中字符集是由ISO 10646定义的,numbering应该在Unicode的标准中有(?^_^我也没看过,不确定).utf-8是Unicode提供的用于解决编码子问题的方案之一,同时还有utf-16和utf-32等等编码方案.

Q: code page呢?
A: code page就是coded character set,最初是IBM使用的一个术语,后来微软也大量使用.

这就是我的demystifying encoding problem, 如有不当请指教.
http://www.niyue.com

参考文献:
[1] Glossary of Unicode Terms http://www.unicode.org/glossary/
[2] Unicode in Wikipedia http://en.wikipedia.org/wiki/Unicode
[3] Character encoding in Wikipedia http://en.wikipedia.org/wiki/Character_encoding

Goodbye ink

In learningother on 8月 20, 2006 at 9:48 上午

前段时间帮同学写了一篇英语作文,主题是“信息时代传统书籍是否还有存在的必要”,今天整理的时候翻了出来,post到这里,立此存照。可惜字数要求在200字左右,很多东西都没写清楚,感觉没写够:-(

Good bye ink

With the advent of the Internet era, computers play a more and more important role in our life. Increasingly more information is delivered through the Internet rather than the traditional ink-based media, such as newspaper and books. In my humble opinion, the daily newspaper and books will be vanishing away, sooner than you think.
In such an information-exploded world, newspaper could not keep pace with the change of things. The zippergate scandal of Bill Clinton was unveiled by an unknown blogger, and the 9/11 attacks was mainly reported through thousands of sites in the Web. People are accustomed to acquire the latest news from their favourite websites rather than the newspaper they subscribed. Power has moved from the old elite to bloggers.
In the same era, more books are digitized. What are the advantages of digital books? Let me count the ways. I don’t have to decide what to take on holiday to read; I just take my whole library. Colour is free: it costs no more to produce a colour book than a black and white one. Publishing costs are really low, and amateurs can publish books just as easily as publishers can. Small language groups can afford to keep their literature available. There’s no need to go on. Although real books smell nice, it’s inevitable that they will be eliminated in the near future.
To sum up, our generation will finally witness the demise of these traditional media. It is with a mixture of great sorrow and joy, in the same time, it is signiture of social progress and is unavoidable to happen.

这是引用了信息指纹及其应用一贴的某篇文章

In ideaother on 8月 10, 2006 at 9:21 下午

一直看GoogleChinaBlog,很想在上面留个言,不过那里好像不提供留言功能的说,唯一的留下自己痕迹的方法好像就剩下Backlink了.今天就借个机会backlink一下,本来还想顺便给自己的blog也加上backlink的功能的,不过好像本人RP实在太差,导致PR值也不高,”link:blog.niyue.com“在Google上面搜索了一下居然一个站点也没有链接到这里,加到这里反而变成自取其辱了,实在不能满足本人blogger ego的需要,于是就放弃了.
本来还想借这篇文章顺便提高一下PR值的(backlink了GoogleChinaBlog之后也会被link到GoogleChinaBlog上,不知道Google自己的网站连出去的站点会不会特地提高一下PR^_^),不过发现这种SEO的策略是行不通的,只能希望Google的爬虫还爬的到这里能够找到这个backlink,这样还能够借GoogleChinaBlog带点人气呵呵,如果你是通过GoogleChinaBlog上的信息指纹及其应用这篇文章surfing到这里来的,麻烦请留个名让我知道一下:-)

China-pub RSS订阅

In other on 7月 15, 2006 at 2:32 下午

今天上China-pub的时候,终于看到了China-pub提供了书籍查询和新书的RSS订阅服务.原来China-pub没有提供这一服务,对于跟踪新书很不方便,经常要登录到它的网站上去看,后来还用Feed43的服务自己定制了一个China-pub 15天内新书查询的RSS源,不过很不稳定,HTML页面解析模式经常有问题,现在有了官方的RSS源就简单多了,立即add to bloglines :-).
还顺便去DearBook也看了看,原来那里也已经有RSS订阅了,而且还是使用了FeedSky,看样子比China-pub应该要更早提供这个服务,也更有经验一些.现在另外一个比较期待的RSS源就是Chinaren校友录了,虽然Suho提供了订阅服务,但是一定要用它那个奇怪的什么狗的Feed阅读器,我认为会使用Feed进行新闻浏览的人一定都对这种作法很反感的,而不会用的人肯定也不会因此改变自己的阅读习惯,还是每次登录然后浏览,所以这完全是吃力不讨好的动作,要开放就开放的彻底一些吧.