LinuxSir.Org  
| 网站首页 | 论坛帮助 |

欢迎来到LinuxSir.Org!
您还未登录,请登录后查看论坛,或者点击论坛上方的注册链接注册新账号。


发表新主题 回复
精华主题  
主题工具
旧 06-11-22, 13:22 第 31 帖
Archx
 
 
 
注册会员  
  注册日期: Oct 2006
  帖子: 111
  精华: 0
 

怎么把scim里面的用户词库转化过来呢
  Archx 当前离线   回复时引用此帖
旧 06-12-01, 19:48 第 32 帖
blance 帅哥
 
blance 的头像
 
 
注册会员  
  注册日期: Sep 2005
  我的住址: JX NC
  帖子: 1,060
  精华: 2
 

这个东西有当然比没有强,但是这样也解决不了根本的问题
个人还是觉得,进一步完善fictx才是关键,比如可以增加备份和恢复词库的功能,这样,每个人都有自己的词库,何必非要用别人造好的词呢?

倒是现在fcitxouer还是有不能输入中文的时候,必须关闭那个程序才行~我就在用firefox另存时候输入中文名遇到过几次不能输入的问题,必须关闭firefox然后再重新打开才行







__________________
Dell inspiron1525
CPU: T8300 , RAM: 2G/800 , SSD: intel40G , Chipest: G965 , WLAN: Intel5300abgn
  blance 当前离线   回复时引用此帖
旧 06-12-06, 19:39 第 33 帖
rushrush 美女
 
rushrush 的头像
 
 
注册会员  
  注册日期: Aug 2004
  帖子: 666
  精华: 0
 

关于备份和恢复词库的功能,,,只要自己复制 ~/.fcitx 目录就行了
我希望下一版能提高稳定性。。。而且要是能直接读取极点输入法的码表就好了 ^^







__________________
by 断了的猫 (arch linux)
blog: http://rushrush.cublog.cn
新浪微博: http://t.sina.com.cn/mao8421
  rushrush 当前离线   回复时引用此帖
旧 07-06-01, 15:34 第 34 帖
wpyh
 
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 57
  精华: 1
 

修改贴子好像不能把贴子放到最前面,所以自己顶一个了。

对了,我的邮箱是williampoetra@gmail.com,那个yahoo的基本上不用了。
  wpyh 当前离线   回复时引用此帖
旧 07-06-01, 15:45 第 35 帖
econy
 
econy 的头像
 
 
注册会员  
  注册日期: Nov 2005
  帖子: 120
  精华: 0
 

支持,我有紫光拼音输入法的文本文件格式的词库,需要吗?







__________________
----------------------------------------------------------------------------------------
*******爱拼才会赢******
---PIII 800,512M内存,80G硬盘,realtalk网卡,Intel815集成显卡,技嘉主板
---windows xp sp3和Centos-2.6.18以及ubuntu-2.6.24
  econy 当前离线   回复时引用此帖
旧 07-06-02, 00:52 第 36 帖
wpyh
 
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 57
  精华: 1
 

你是说紫光自带的词库,还是你自己的词库?如果是紫光的我们估计也不能用……(要看它的协议)
  wpyh 当前离线   回复时引用此帖
旧 07-06-02, 09:48 第 37 帖
kde
 
 
 
注册会员  
  注册日期: Jul 2003
  帖子: 117
  精华: 0
 

suzhe 说的例子是错的:便宜 pian2yi2 和 bian4yi2 都是正确的,只不过含义不同,使用场合不同罢了。好在 fcitx 的拼音佳佳词库里这两个拼音都是有的。

另外有人反映说使用了拼音佳佳词库后自己的常用词被挤到了后面,这其实是用户设置的问题,在 magic linux 2.1 下,我们通过修正配置的方法,实用户自己的常用词总是排在最前面,所以不会有那种问题。所以,建议今后 fcitx 默认开启词频调整,将最常用的词排在最前方。
  kde 当前离线   回复时引用此帖
旧 07-06-04, 03:46 第 38 帖
wpyh
 
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 57
  精华: 1
 

引用:
作者: kde
另外有人反映说使用了拼音佳佳词库后自己的常用词被挤到了后面,这其实是用户设置的问题,在 magic linux 2.1 下,我们通过修正配置的方法,实用户自己的常用词总是排在最前面,所以不会有那种问题。所以,建议今后 fcitx 默认开启词频调整,将最常用的词排在最前方。
怎么该配置?分享一下吧~ 毕境不是每个人都用magic linux 2.1 ……
  wpyh 当前离线   回复时引用此帖
旧 07-06-05, 12:06 第 39 帖
hsmwrv
 
 
 
注册会员  
  注册日期: Apr 2007
  帖子: 14
  精华: 0
 

五笔爱好者论坛有许多优秀的五笔输入法词库,如果能将它们转换成fcitx的词库,可以省去许多不必要的重复开发。

http://www.wbfans.com/bbs/viewthread...extra=page%3D1
  hsmwrv 当前离线   回复时引用此帖
旧 07-06-08, 10:03 第 40 帖
vbbjq
 
 
 
注册会员  
  注册日期: Aug 2003
  帖子: 120
  精华: 0
 

建议开发工具来转换拼音加加的词库,这样能减少不少功夫。。。。。。。。。
收集一个词库是需要很长时间的。。。。。。。。
  vbbjq 当前离线   回复时引用此帖
旧 07-06-21, 23:50 第 41 帖
wpyh
 
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 57
  精华: 1
 

@hsmwrv: 那些词库有没有协议呢?还是public domain?
@vbbjq : 其实fcitx本身就已经自带拼音佳佳的词库。但是这个词库的协议不太爽──只能在fcitx中使用,而这是doc/pinyin.txt的内容:

拼音词库取自于 拼音佳佳4.0(已经经作者本人同意使用)。
请未经作者本人同意,禁止将该词库用于其它场合。
有关版权问题,请与QQ:70387370(拼音佳佳)联系。
其它问题(如注音错误等),请与本人联系(yuking_net@sohu.com)。

我还没有跟拼音佳佳联系(最近没有上qq了,呵呵)但是我觉得既然有这种限制性的条件,怎么能称为开源的呢?fcitx本身是开源的,但是词库不是。还不如做一个开放的词库。。。
  wpyh 当前离线   回复时引用此帖
旧 07-06-22, 01:55 第 42 帖
diony
 
diony 的头像
 
 
注册会员  
  注册日期: Jan 2005
  帖子: 2,162
  精华: 10
 

如果有人愿意做一个在线上传、分析、整理词库的web应用程序,我愿意提供一台服务器资源……

感觉做一个实现了下面功能的web程序来达到整理词库的目的还是不错的:
1、用户上传词库,自动合并到已有词库并调整相应词频。
2、用户可以在页面上汇报bug,比如某个词的音是错的,某个词有白字等等。管理者通过后直接作用在已有词库上,进行相应的增删、修改。
3、用户可以将较长短语(比如唐诗宋词)和专业性较强的词汇(比如堆栈)等进行在线分类,管理者通过后直接作用在已有词库上进行相应分类。用来实现类似sogou将要推出的3.0beta2的所谓“细胞词库”功能。
4、越方便越好,操作越方便,就有越多的人乐于把自己的词库上传。

服务器相关配置:双核双Xeon 2.66 64bit,2G ECC RAM,250G SATA。apache,php,mod_python。







__________________
Desktop:
| Core2Duo E6550 | ECS P35T-A | 2G DDR800 X 2 DualChannel | HD4870|
640G SATA X 1
500G SATA X 2
320G SATA X 1

Laptop:
ASUS A8SC Z99S

-------------
别把别人当成猪,但愿自己不是狗。
-------------
  diony 当前离线   回复时引用此帖
旧 07-07-13, 23:24 第 43 帖
ctqucl 帅哥
 
ctqucl 的头像
 
 
注册会员  
  注册日期: Nov 2004
  我的住址: 二樓
  帖子: 525
  精华: 0
 

很希望能实现类似sogou的细胞词库功能,我急需一个股票名称缩写的词库,省事啊。
细胞词库的格式希望能用开放的格式,xml什么之类的,维护也方便,词库也占不了多少空间,sogou已经开始封闭其词库资源了,不是个好现象啊,如果fcitx有了自己的细胞词库系统,借助广大爱好者的支持,肯定会壮大起来,而且也许会得到其它输入法软件的支持,版权还是希望GPL,这东西卖不了钱的,还不如干脆点,最大限度的保护它本身吧。

同样还是希望能把fcitx的开发继续下去,两者真正的合而为一才更有意义啊。:D,我不知道谁写代码专业不专业,我只知道软件适合我用就是好软件,应用为本,作者您也许有些意懒了,不过我还是求求您继续开发吧,如果能有细胞词库功能,我一定尽我一份力,写代码我没能力接您班,不过弄些词库什么的我很有积极性参与的,
我并不想期待某某商业公司将来开发这样的产品,fcitx毕竟存在很多年,大家都习惯了,也有感情了,而且网友作品,多有个性啊。







__________________
东逛西晃,不学无术。
  ctqucl 当前离线   回复时引用此帖
旧 07-07-14, 11:28 第 44 帖
ctqucl 帅哥
 
ctqucl 的头像
 
 
注册会员  
  注册日期: Nov 2004
  我的住址: 二樓
  帖子: 525
  精华: 0
 

今天研究了下fcitx的词库,哪位能写个代码让词库的词能由单字库里的字的注音自动生成词的注音?
这样我立马就可以使用sogou上面的词库的txt文本了。
虽然这样生成的词库注音会存在多音字的错误,但是比一个个手动输要方便太多了。
当然,最好还是希望fcitx能直接支持没有注音的词库,这样会更方便,而且容错上也会更好。

此帖于 07-07-14 11:31 被 ctqucl 编辑.
  ctqucl 当前离线   回复时引用此帖
旧 07-07-14, 12:44 第 45 帖
wpyh
 
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 57
  精华: 1
 

ctqucl:

我目前只是一个人在开发词库,所以开发也很慢。基本上就是:
- 上网,打字,写论文,这些词会自动加到我的个人词库里面。
- 然后我有时间的时候,或者无聊的时候,把个人词库拿出来,转化成txt格式的
- 转化成txt完了,整理,然后发布
所以比较慢。我之前是说了,大家给我发,发给我了就会加到词库里面,但是……没有人给我发。(可能是邮箱错了吧?我改改邮箱)

你的建议,我觉得首先要看,sogou的词库,是什么版权?有版权还是public domain的?还是有什么协议?

我的另一种想法是,能不能找大量的public domain的文字数据,然后自动分词。用过OpenOffice的同学应该知道,OpenOffice是会识别词的。虽然不可能100%准确,但是分词完了可以人工检查。

总之,目前需要public domain的词,否则还不如继续用pyjj的词库了。虽然public domain还是可能被某些大公司滥用,但是目前这是唯一可行的方法。也许GPL也可以,但是GPL的话很多别的项目就不能用我们的词库了,我觉得这样不好。除非著作权的拥有者只有一个,或者只有一个组织,比如说“词库开发团队”,我们用GPL形式的话很麻烦的,假设一个BSD项目想要用我们词库,那么我们就必须找齐所有的开发者。
  wpyh 当前离线   回复时引用此帖
发表新主题 回复


主题工具

发帖规则
您 [不可以] 发表新主题
您 [不可以] 回复主题
您 [不可以] 上传附件
您 [不可以] 编辑您的帖子

已 [启用] BB 代码
已 [启用] 表情符号
已 [禁用] IMG 代码
已 [禁用] HTML 代码
[论坛跳转…]


所有时间均为[北京时间]。现在的时间是 12:51


Powered by vBulletin 版本 3.6.8
版权所有 ©2000 - 2012, Jelsoft Enterprises Ltd.
官方中文技术支持: vBulletin 中文
版权所有 ©2002 - 2011, LinuxSir.Org