LinuxSir.Org  
| 网站首页 | 注册账号 | 论坛帮助 |

欢迎来到LinuxSir.Org!
您还未登录,请登录后查看论坛,或者点击论坛上方的注册链接注册新账号。


发表新主题 回复
 
主题工具
旧 08-10-29, 08:42 第 1 帖
waterloo2005
 
 
 
注册会员  
  注册日期: Feb 2007
  帖子: 1,518
  精华: 0
 

标题: 自己些个像搜狗那样的输入法程序难吗?


用什么语言写,大概多少行代码?谢谢
  waterloo2005 当前离线   回复时引用此帖
旧 08-10-29, 09:00 第 2 帖
狱卒 帅哥
 
狱卒 的头像
 
 
注册会员  
  注册日期: Feb 2003
  我的住址: 湖北 荆州
  帖子: 1,645
  精华: 2
 

这问题真是...

难不难取决于你的知识和经验。
用什么语言?先问自己会哪些语言。
大概多少行代码,还没开工,谁会知道要写多少行代码?
  狱卒 当前离线   回复时引用此帖
旧 08-10-29, 10:44 第 3 帖
waterloo2005
 
 
 
注册会员  
  注册日期: Feb 2007
  帖子: 1,518
  精华: 0
 

为什么我们不自己写个呢?
在开源的架构下不断完善
的确linux的普及,输入法是很重要的一环
  waterloo2005 当前离线   回复时引用此帖
旧 08-10-29, 12:18 第 4 帖
mikeandmore 帅哥
 
 
 
注册会员  
  注册日期: Jul 2005
  帖子: 527
  精华: 1
 

发现linux下的xim协议或者库文档非常少。。。
gtk/qt module就好多了。。。
可是不能只指望用户永远在gtk/qt下工作阿。。。

这是我的疑惑。
当然还有更多的问题。。。
比如平滑匹配。
反正感觉不是非常简单。







__________________
从今天开始,做个纯洁的孩子
  mikeandmore 当前离线   回复时引用此帖
旧 08-10-31, 13:38 第 5 帖
化外愚民
 
化外愚民 的头像
 
 
注册会员  
  注册日期: Nov 2006
  帖子: 133
  精华: 0
 

没觉得搜狗输入法多好啊。甚至觉得连输入法的边都沾不着,只能算是玩具。
  化外愚民 当前离线   回复时引用此帖
旧 08-11-02, 16:26 第 6 帖
bruceasu
 
bruceasu 的头像
 
 
注册会员  
  注册日期: Mar 2005
  帖子: 59
  精华: 0
 

估计楼主说的是拼音类的输入法。
编写好用的拼音输入法,最关键的是智能算法──这个需要丰富的自然语言处理模型等人工智能专业知识,相关的数学模型和比较不错的编写代码能力。就目前而已,个人能力实在有限,不可能写出这样的程序。现在公开的,使用广泛的输入法内核基本都是给予简单的码表转换的。这种算法只能用在像五笔之类不须要很高智能的输入法方式。fcitx的拼音部分是从红旗那里弄来的,有一定的智能;五笔部分也是在用户体验下功夫,并没有在内核方面有所突破。scim的智能拼音是闭源的。不知道它的算法是什么。目前可以在网上找到的拼音输入法的算法有:fctix,大熊猫输入法(free pinyin for windows),新酷音(台湾),sun 拼音。其中算的上智能是后两种,请有志者努力开发更智能的拼音输入法。







__________________
Slackware 的門徒
zenwalk linux 6
Compaq 6515b (CPU: AMD Turion 64x2 / Memory : 2G / Wifi & NetCard: BCM / Sound Card: HD-Intel / Video Card: ATI x1250)
  bruceasu 当前离线   回复时引用此帖
旧 08-11-03, 09:00 第 7 帖
waterloo2005
 
 
 
注册会员  
  注册日期: Feb 2007
  帖子: 1,518
  精华: 0
 

引用:
作者: 化外愚民
没觉得搜狗输入法多好啊。甚至觉得连输入法的边都沾不着,只能算是玩具。
哦,为什么?
那真正的输入法该是什么样子的。
  waterloo2005 当前离线   回复时引用此帖
旧 08-11-09, 15:47 第 8 帖
epico
 
 
 
注册会员  
  注册日期: May 2006
  帖子: 44
  精华: 0
 

可以试试novel-pinyin.
  epico 当前离线   回复时引用此帖
旧 08-11-11, 13:42 第 9 帖
化外愚民
 
化外愚民 的头像
 
 
注册会员  
  注册日期: Nov 2006
  帖子: 133
  精华: 0
 

引用:
作者: waterloo2005
哦,为什么?
那真正的输入法该是什么样子的。
起码得是单字能力过得去的。用大词库想回避单字是不成的,因为很多单字的组合并不是词,否则若想强将这些不是词的单字组合勉强当作词来处理的话,那么词添的越多越不够用。
  化外愚民 当前离线   回复时引用此帖
旧 08-11-13, 11:45 第 10 帖
云和山的彼端
 
云和山的彼端 的头像
 
 
注册会员  
  注册日期: Nov 2002
  帖子: 157
  精华: 0
 

啥叫单字能力?我问这个问题仅仅是想知道搜狗的缺点。
  云和山的彼端 当前离线   回复时引用此帖
旧 08-11-18, 17:04 第 11 帖
chencbin
 
 
 
注册会员  
  注册日期: Jan 2006
  帖子: 99
  精华: 0
 

linux下的拼音输入法要赶上MSPY2007(微软拼音2007),目前来看,还不太现实.个人感觉巨蟒拼音算是目前较好的拼音输入法.
  chencbin 当前离线   回复时引用此帖
旧 08-11-20, 09:07 第 12 帖
化外愚民二
 
 
 
注册会员  
  注册日期: Nov 2008
  帖子: 2
  精华: 0
 

引用:
作者: 云和山的彼端
啥叫单字能力?我问这个问题仅仅是想知道搜狗的缺点。
不知道怎么的,我的密码怎么填也不对了。就再注册一个号来回答吧。

单字能力就是打单字的能力啊。搜狗等拼音输入法,无论怎么弄大词库来回避单字,也是不成的,因为很多单字的组合并不是词,比如说“票已售完”这样很普通的单字组合。

因此,用搜狗这类的输入法,只能是顺着输入法打(即用你所记住的词来“接龙”),而不能真正自由灵活地打。因此我才说,搜狗类的输入法并不是真正的输入法,只是一个输入法玩具。
  化外愚民二 当前离线   回复时引用此帖
旧 08-11-20, 17:05 第 13 帖
月魄孤魂
 
月魄孤魂 的头像
 
 
注册会员  
  注册日期: Nov 2008
  我的住址: 广东-深圳
  帖子: 320
  精华: 0
 

拼音多麻烦,还是用五笔吧,程序又容易写,用又容易用,简单、快捷。







__________________
ArchLinux 2.6.27-ARCH i686
Intel(R) Celeron(R) CPU 2.66GHz GenuineIntel
Nvidia GeForce FX 5200/AGP/SSE2
SANSUNG SP0802N(ATA)
HYNIX DDR400 1G+Kingston DDR400 256M
  月魄孤魂 当前在线   回复时引用此帖
旧 08-11-20, 17:27 第 14 帖
waterloo2005
 
 
 
注册会员  
  注册日期: Feb 2007
  帖子: 1,518
  精华: 0
 

引用:
作者: 化外愚民二
不知道怎么的,我的密码怎么填也不对了。就再注册一个号来回答吧。

单字能力就是打单字的能力啊。搜狗等拼音输入法,无论怎么弄大词库来回避单字,也是不成的,因为很多单字的组合并不是词,比如说“票已售完”这样很普通的单字组合。

因此,用搜狗这类的输入法,只能是顺着输入法打(即用你所记住的词来“接龙”),而不能真正自由灵活地打。因此我才说,搜狗类的输入法并不是真正的输入法,只是一个输入法玩具。
因此,用搜狗这类的输入法,只能是顺着输入法打(即用你所记住的词来“接龙”),而不能真正自由灵活地打

这句是什么意思? sogou的技术含量到底怎么样?
  waterloo2005 当前离线   回复时引用此帖
旧 08-11-21, 09:35 第 15 帖
化外愚民
 
化外愚民 的头像
 
 
注册会员  
  注册日期: Nov 2006
  帖子: 133
  精华: 0
 

引用:
作者: waterloo2005
因此,用搜狗这类的输入法,只能是顺着输入法打(即用你所记住的词来“接龙”),而不能真正自由灵活地打

这句是什么意思? sogou的技术含量到底怎么样?
原来这个论坛的登录得需要脚本,我还当密码错了呢,一直登不上。

比如说你打我举的那个例子“票已售完”,你用搜狗怎么打?恐怕打起来很是费劲。
再比如说“十个左右打转”,意思就是“十个左右上下”的差不多的意思,只是另外一种说法,你用搜狗怎么打?

就是说,有些字的组合并不是词(如前例),再说即便是词,还有的词是重码呢(如后例,“打转”和“大专”重码),因此,单字能力回避不过去的。

因此,你用这样的输入法打,就得顺着输入法打,就是说, 你想到了“票已售完”这个字组合后,却不能这样打,得从脑子里转换,换个别的打法,比如说“电影票已经出售完了”,或“球票已经出售完了”(或是“卖完了”)。这就是受制于输入法了。

搜狗也罢,qq输入法也罢,谷歌输入法也罢……此类的输入法,基本就是一个模子出来的,同质化很重,因此,技术含量怎么样……我就不好说了。
  化外愚民 当前离线   回复时引用此帖
发表新主题 回复


主题工具

发帖规则
您 [不可以] 发表新主题
您 [不可以] 回复主题
您 [不可以] 上传附件
您 [不可以] 编辑您的帖子

已 [启用] BB 代码
已 [启用] 表情符号
已 [禁用] IMG 代码
已 [禁用] HTML 代码
[论坛跳转…]


所有时间均为[北京时间]。现在的时间是 13:00


Powered by vBulletin 版本 3.6.8
版权所有 ©2000 - 2010, Jelsoft Enterprises Ltd.
官方中文技术支持: vBulletin 中文
版权所有 ©2002 - 2009, LinuxSir.Org