易码技术论坛

 找回密码
 加入易码
搜索
楼主: 林木森

[工具] 词典引擎GVMdict V9.0版(20070416)

[复制链接]
 楼主| 发表于 2006-12-23 10:16:00 | 显示全部楼层
下一版本将有重大改进,所以决定改名为GVMdict  V9.0 ,下周五我们就考完了,考完马上开始整理编写代码,GVMdict  V9.0 将有的功能有:
1.改变搜索方式,数据结构采用索引检索,但索引和数据还在一起,因为打开两个文件时速度将大大降低,查询可能要用KMP算法,大大提高查询速度。
2.增加配置文件GVMdict.dat,保存有关内容和用户设置。
3.增加日语输入界面,在输入界面按F4可切换日/英,汉,数输入法。
4.接受网友的意见,智能选择已下载到GVMdict文件夹下的辞典并显示供选择。
5.接受网友的意见,增加设置默认查询词典的功能,方便小内存用户只下一本词典时跳过词典选择界面。
6.提供两种显示方式,一种是只显示单个单词,一种可以显示所有上下文的单词。
7.去除现在显示词典内容时单词前后的符号@#,改为单词和单词之间有一空行,并且为了醒目单词前只加一个★。
即:

★take
解释部分

★taker
解释部分

8.如果能够破译了名人词典数据解释部分的编码格式,将增加读取名人词典的模块,届时将有两种词典资源可供下载了!

不足之处:还未能实现部分匹配查询和同步显示最接近单词或词组的功能。

以上只是我个人想到并将实施的计划,谁还有更好的想法可以和我联系,如果能实现我会考虑的,“辞典融合”功能将不会考虑,因为随着辞典数增加,查询速度将会不堪忍受!这是受到文曲星硬件的限制!

PS:据说GGV要出能插卡的新机器?而且带有GVMaker 2.0?这可真是个好消息啊!到时候再攒钱买个,将来把GVMdict V9.0移植过去,那可真是太爽了!!我那好几百兆的词典数据也有用武之地了!如果GVMaker 2.0速度够快,可用内存够大,那么像好几十兆的WIKI百科也能移植到文曲星上了!!
发表于 2006-12-23 11:21:52 | 显示全部楼层
楼上不考虑PPC了?
发表于 2006-12-23 14:30:20 | 显示全部楼层
继续支持LZ
 楼主| 发表于 2006-12-23 20:36:19 | 显示全部楼层
引用第162楼十七·烈行风2006-12-23 11:21发表的“”:
楼上不考虑PPC了?

唉!看了看好点的PPC都在3000以上,可怜我还没有买电脑呢,怎舍得花那么多买呢!
还是先玩着文曲星吧,等再过俩年挣钱了再买吧!
 楼主| 发表于 2007-1-1 14:50:58 | 显示全部楼层
这次准备重新改写代码,全部用GVM2.0和LavaX3.5中共有的函数编写,方便日后移植!
GVmaker1.0估计将会很快淘汰了
发表于 2007-1-1 16:18:18 | 显示全部楼层
呵呵,其实楼主不用考虑这么多,先慢慢来,其实如果能做到GGV自带的那种查询速度,辞典融合速度也就不难实现了,GGV自带字典在PC505这样的机子上速度都非常快.
林木森可以考虑如果去对字典数据进行编码,采用新的算法,等等,应该可以解决这些问题.因为3000的CPU应该至少比PC505快10倍吧?

如果可能的话可不可以考虑开放源代码,让大家一起做呢
发表于 2007-1-1 16:26:14 | 显示全部楼层
ggv的字典不知道采用怎样的编码格式,除了那些采用USB接口的词典之外,其它的字典查询速度很快,这是我选择NC3000的原因,每次看同学买了新的文曲星后,我都不明白文曲星为什么要抛弃自己比较成熟的字典查询技术,现在的Y400等机型速度明显慢了好多
发表于 2007-1-2 04:20:54 | 显示全部楼层
引用第167楼yf3504397562007-01-01 16:26发表的“”:
每次看同学买了新的文曲星后,我都不明白文曲星为什么要抛弃自己比较成熟的字典查询技术,现在的Y400等机型速度明显慢了好多
可能ggv公司管理不行,有才能的只能昙花一现,以至奸丞当道..........
Hehe~~~~
 楼主| 发表于 2007-1-10 12:16:58 | 显示全部楼层
引用第166楼yf3504397562007-01-01 16:18发表的“”:
呵呵,其实楼主不用考虑这么多,先慢慢来,其实如果能做到GGV自带的那种查询速度,辞典融合速度也就不难实现了,GGV自带字典在PC505这样的机子上速度都非常快.
林木森可以考虑如果去对字典数据进行编码,采用新的算法,等等,应该可以解决这些问题.因为3000的CPU应该至少比PC505快10倍吧?

如果可能的话可不可以考虑开放源代码,让大家一起做呢

好久没来,看来这位仁兄真的该学习一下了:
(1)GGV自带的辞典查询用的是6502汇编语言,本身就比LAVA快。
(2)GGV的自做词典其大小每个不能超过1.5M,词典融合也限制在6本以内!(加起来也只不过9M,而OALD4一本就比这大!)
(3)在这种条件下,要么追求查询速度,要么追求辞典的质量(好辞典肯定体积都比较庞大),不可能兼而得之,我们用LAVA作出的辞典只能通过算法尽量快点,而不可能检索大文件(像十几,二十几M)也达到6502汇编语言的速度!
 楼主| 发表于 2007-1-10 12:19:03 | 显示全部楼层
引用第167楼yf3504397562007-01-01 16:26发表的“”:
ggv的字典不知道采用怎样的编码格式,除了那些采用USB接口的词典之外,其它的字典查询速度很快,这是我选择NC3000的原因,每次看同学买了新的文曲星后,我都不明白文曲星为什么要抛弃自己比较成熟的字典查询技术,现在的Y400等机型速度明显慢了好多


想知道编码格式很简单的,把辞典制作工具反汇编一下不就知道了!
 楼主| 发表于 2007-1-10 12:21:02 | 显示全部楼层
引用第166楼yf3504397562007-01-01 16:18发表的“”:
呵呵,其实楼主不用考虑这么多,先慢慢来,其实如果能做到GGV自带的那种查询速度,辞典融合速度也就不难实现了,GGV自带字典在PC505这样的机子上速度都非常快.
林木森可以考虑如果去对字典数据进行编码,采用新的算法,等等,应该可以解决这些问题.因为3000的CPU应该至少比PC505快10倍吧?

如果可能的话可不可以考虑开放源代码,让大家一起做呢

在这个软件没有达到我期望的那么成熟之前,我是不会公开源代码的!
发表于 2007-1-10 12:56:05 | 显示全部楼层
老大,我需要全唐诗,给我把
发表于 2007-1-19 13:44:47 | 显示全部楼层
谁可以帮我把TC800的剑桥弄掉,没中文的我看不懂,要了也没用~
发表于 2007-3-5 21:39:22 | 显示全部楼层
怎么用啊
发表于 2007-3-6 12:35:15 | 显示全部楼层
楼主会做俄汉词典吗?我正愁没人做下去呢.
发表于 2007-3-7 09:18:56 | 显示全部楼层
建议在dic文件里加入索引index,以加快较大字典的查询速度,现在的gvmdict对大字典的速度相当慢。所以按需加上索引,例如:在OAD4.dic中B的位置为73F02H,C的是F9755H,我们在dic文件中加入索引头,让软件先读到的第一个字母为B,先将指针移到73F02H处再用全字符查找,速度会提高许多,缺点是增大字典文件。但增大不了多少,因为可以只做首字母或前几个字母的索引。
发表于 2007-3-7 09:19:20 | 显示全部楼层
双模式查找,可能有时无法保证有足够空间来装下含索引的.dic,所以可以让软件检查是否有独立的字典索引文件.idx,若有则进入索引查找模式,没有则进入文本查找模式。
发表于 2007-3-7 17:56:26 | 显示全部楼层
我想要全唐诗啊~发出来好么?要不发到我的EMAIL
kuilisong@yahoo.com.cn
 楼主| 发表于 2007-3-10 09:46:44 | 显示全部楼层
引用第175楼sargehsy2007-03-06 12:35发表的“”:
楼主会做俄汉词典吗?我正愁没人做下去呢.

俄汉词典的输入法怎么处理阿,文曲星能显示俄语字母吗?要是能就可以做。
你要有词典数据可以发到我邮箱里。
lms207@126.com
 楼主| 发表于 2007-3-10 09:48:46 | 显示全部楼层
引用第176楼705992007-03-07 09:18发表的“”:
建议在dic文件里加入索引index,以加快较大字典的查询速度,现在的gvmdict对大字典的速度相当慢。所以按需加上索引,例如:在OAD4.dic中B的位置为73F02H,C的是F9755H,我们在dic文件中加入索引头,让软件先读到的第一个字母为B,先将指针移到73F02H处再用全字符查找,速度会提高许多,缺点是增大字典文件。但增大不了多少,因为可以只做首字母或前几个字母的索引。

想到了,下一版本就会是这样的。
您需要登录后才可以回帖 登录 | 加入易码

本版积分规则

Archiver|手机版|小黑屋|EMAX Studio

GMT+8, 2024-4-29 13:43 , Processed in 0.012387 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表