2007年3月30日

报道,在Google翻译项目负责人Franz Och在阐述google的统计式翻译时举例:

Google的翻译程序运用了统计学分析方法,Och希望这种方法可以避免出现外交辞令上的失礼,比如,当俄罗斯总统普京德国总理施罗德给打电话时,普京称施罗德是德国“Fuehrer”(德语:元首),普京的翻译顿感恼火,因为,在德语里面,这个词是专指希特勒的,属于禁忌词汇。Och说:“在我们的系统中,元首施罗德出现的次数绝对要少于德国总理施罗德出现的次数,因此,我们的翻译系统就会采用德国总理的称呼。”

但施罗德不是永远的总理。如果他下台了,机器根据统计数据仍然会称其为总理,而不会自动改口为前总理,直到前总理的出现频度足够高。

这个”慢热”问题在Google搜索引擎中也存在,表现为对新网站的评价和收录上。虽然,Google已经增加了很多指标,试图给新资料更高的分数,但仍不能彻底解决问题。又引发了沙盒效应。统计方法在搜索中不是万能的,在翻译中也不是万能的。

原文永久链接:http://jijian91.com/blog20070330/google-statistics-translation.html

一直在用SQL Server 2000,但很多问题都没深究。该总结一下了。

存储过程和用户定义函数都是“SQL语句组成的子程序,用以封装代码以便重复使用”。但区别也是显而易见的。简单说,存储过程功能强大,但调用不便,用户函数正相反。

用户定义函数的优点
可以在SQL语句中调用,直接使用返值,从而形成复杂的SQL应用。
存储过程则只能用execute命令调用,用输出参数的到返回的结果。

用户定义函数的缺点
能在函数中使用的语句有严格限制:

  1. 不支持create、drop等DDL命令
  2. insert、delete、update只能用在临时表上
  3. 不支持动态SQL
  4. 不支持“不确定”的函数,比如常用的getdate。不确定函数是指输入参数相同,返回结果可能不同的函数。全部不确定函数如下表
    @@CONNECTIONS @@TOTAL_ERRORS

变通办法
要解决用户函数的种种限制,可以巧妙运用用户函数调用存储过程。

比如,需要在函数中用getdate,就写个存储过程返回getdate的结果。然后从函数里去调用这个存储过程。需要在函数中使用update等,也可类推。

原文永久链接:http://jijian91.com/blog20070330/sql-server-procedure-vs-function.html

  今天发现blogger提交文章成功页上给adsense作广告:

把广告放大看看:

点”Google AdSense”链接进入blogger的adsense设置页面。

原文永久链接:http://jijian91.com/blog20070330/google-blogger-adsense-ad.html

  短暂的解封之后,blogspot.com今天10点多又不行了。当访问的通畅都是问题,也就谈不到其他了。我前些日已经把生活和娱乐blog迁到新址了。现在考虑是否把本blog也迁过去。

blogspot被封的判断方法

1. ping网址
被封的效果
ping jijian91-tec.blogspot.com

Pinging blogspot.l.google.com [72.14.207.191] with 32 bytes of data:
Request timed out. 不通
Request timed out.

解封的效果(修改hosts后也是如此):
ping jijian91.blogspot.com

Pinging jijian91.blogspot.com [72.14.219.190] with 32 bytes of data:
Reply from 72.14.219.190: bytes=32 time=235ms TTL=229 通!
Reply from 72.14.219.190: bytes=32 time=236ms TTL=229

2. 用tracert跟踪
被封的效果
tracert jijian91-tec.blogspot.com

Tracing route to blogspot.l.google.com [72.14.207.191]
over a maximum of 30 hops:

1 从这里断掉了!这是北京网通主干网的IP
11 202.97.34.225 reports: Destination host unreachable.

Trace complete.

解封的效果(修改hosts后也是如此):
Tracing route to jijian91.blogspot.com [72.14.219.190]
over a maximum of 30 hops:

1 <10 style=”color: rgb(255, 0, 0);”>没有断
12 24 ms 24 ms 24 ms 202.97.33.58
13 27 ms 27 ms 26 ms 202.97.33.54
14 63 ms 63 ms 63 ms 202.97.4.46
15 260 ms 258 ms 258 ms 216.239.47.237 这是美国google的IP
16 254 ms 212 ms 259 ms 72.14.239.13
17 201 ms 201 ms 201 ms 72.14.233.117
18 280 ms 277 ms 277 ms 72.14.236.26
19 236 ms 236 ms 237 ms 72.14.236.173
20 268 ms 245 ms 238 ms 216.239.43.186
21 237 ms 237 ms 236 ms jijian91.blogspot.com [72.14.219.190] 成功访问

Trace complete.

原文永久链接:http://jijian91.com/blog20070330/blogger-blocked.html

2007年3月29日

早晨在cnBeta看到一篇《商务部:网上聊天记录可作交易纠纷处理凭证》:

国家商务部日前出台的《关于网上交易的指导意见(暂行)》规定,在网上订立合同时,交易各方可采用电子邮件、网上交流等方式,且交易各方可以自行保存各类交易记录,以作为纠纷处理时的证据.电子商务方面的法律专家高俊表示,该文件为解决网络交易纠纷提供了指导性意见,说明网络上的QQ、MSN聊天记录在得到权威机构认定的前提下,也能够成为解决纠纷时的凭证.这表明,国家相关部门正在逐步认可网络上产生的聊天记录等,网络交易市场也在进一步规范.

我的第一反应就是——这太容易造假了。颇费了一些周折,终于在商务部网站上找到了原文件:

《关于网上交易的指导意见(暂行)》(2007年第19号公告)2007年3月6日发布
《关于网上交易的指导意见(暂行)》起草说明 2007年3月12日发布

其中相关的文字是:

交易各方采用电子邮件、网上交流等方式订立合同,应当遵守合同法、电子签名法的有关规定,注意下列事项:  (1)与数据电文确认收讫有关的事项;
(2)以数据电文形式发送的要约的撤回、撤销和失效以及承诺的撤回;
(3)自动交易系统形成的文件的法律效力;
(4)价款的支付,标的物和有关单据、凭证的交付;
(5)管辖法院或仲裁机构的选择,准据法的确定;
(6)法律、法规规定的其他事项。

交易各方通过电子签名签订合同的,要遵守电子签名的法律规定,使用可靠的电子签名,选择依法设立的电子认证服务提供者提供的认证服务。

交易各方可以自行保存各类交易记录,以作为纠纷处理时的证据。大宗商品、贵重商品与重要服务的交易,可以生成必要的书面文件或采取其它合理措施留存交易记录。

服务提供者应特别注意保存网上交易的各类记录和资料,采取相应的技术手段保证上述资料的完整性、准确性和安全性。

如何理解呢?

商务部虽然列出的“各类交易记录”虽然包含“电子邮件、网上交流”,但不等于说法律效力是相同的。按我的理解,法律效力从高到低是:

  1. 电子签名
  2. 服务提供者保存的自动交易系统形成的文件
  3. 服务提供者保存的数据电文、凭证
  4. 当事双方提交的交易记录(邮件、网聊等)

在没有与效力更高的证据相互印证的情况下,网聊记录的可信性很低,被法院采信的可能性也很小。只能算是个参考吧。其实,高俊也提到了”得到权威机构认定“这一前提,不过到了经过编辑的”文字润色”就变了味。

商务部在起草说明中明确提到:指导意见“不具备法律强制力和约束力”,只是对现有法律的汇集。但指导意见在不经意间也有一些新规,例如对网上交易服务提供者的要求。其中要求:

  • 用户要注册,但未提实名注册
  • 服务提供者要保留交易记录
  • 服务提供者要提供卖方信用查询,但未提买方信用

另:
不知为何,按名字查询这个文件的时候,google未将商务部列在前面。商务部不但排在sohu、donews等媒体之后,甚至在很多地方政府网站之后。

商务部的网页只能在IE下打开,不够完善。

原文永久链接:http://jijian91.com/blog20070329/chat-record-transaction.html