lstm纠正错别字模型。
python吧
全部回复
仅看楼主
level 7
阿布阿奇🍭
楼主
从零开始训练,可以识别常见的“的地得”,“做/作”,“在/再”。
训练数据有一半来源于我写的小说,另一半来源于聊天、人工编写,其他来源等。
目的是快速检查自己小说的错误,一个字一个字看太慢了,于是自己训练一个。
代码是AI写的,数据都是自己的,目前效果不错,大部分都能改对。
2025年11月21日 07点11分
1
level 7
阿布阿奇🍭
楼主
未来可能会扩展其他错别字。
2025年11月21日 07点11分
2
level 7
阿布阿奇🍭
楼主
不是预训练模型,从零开始的,用了2000多条文本数据,模型比较小,所以在手机上训练也很快。未来随着数据增多会扩大。
2025年11月21日 07点11分
3
level 7
sunruisunrui
你这种需求,直接用最小的开源的大模型就可以了。0.6B 的就可以。
2025年11月21日 07点11分
4
阿布阿奇🍭
肯定是不行我才自己训的。 大模型回复慢,不像我这个一两秒直接把长文检查完。而且还可能漏掉一些字。
2025年11月21日 09点11分
sunruisunrui
@阿布阿奇🍭
单纯检查用词错误等,小模型肯定够用。
2025年11月21日 17点11分
沙耶香小火车
@阿布阿奇🍭
你有多大的需求量呢?正常写小说的话,一张也就3000字
2025年11月21日 12点11分
沙耶香小火车
@阿布阿奇🍭
我也不说你用付费的gemini3.0了, 正常3000字的上下文deepseek也很难出错吧
2025年11月21日 12点11分
level 8
DogeCN
牛,源码、数据和模型在手比那些语言大模型实在多了
2025年11月21日 16点11分
5
level 8
我有罪请惩罚我吧
其实可以用小模型还有预训练权重重新加权训练,让ai帮你调数据集,参数,写gui之类的。ai给的网络特别阉割
2025年11月22日 00点11分
6
我有罪请惩罚我吧
可以去Modelscope,huggingface这两个社区找一找
2025年11月22日 00点11分
阿布阿奇🍭
感谢提醒,AI要是有阉割的地方我会注意到,改了就基本没事。现在效果也差不多了,在手机上还很快,就不找开源的了。
2025年11月22日 04点11分
level 7
阿布阿奇🍭
楼主
其实也是我对训练模型感兴趣哈哈哈,所以没想找开源的,谢谢大家的建议。
2025年11月22日 05点11分
7
简单男孩geton
佬,回复私聊下
2025年11月22日 11点11分
level 7
阿布阿奇🍭
楼主
回应一下大家说的小模型训练,大家说的都有道理,但我觉得不太可行。因为生成式模型终究不能检查每一个关键字,而且生成的时候还是一个字一个字的蹦出来。没有办法做到瞬间就检查所有字而且还把修改后的全文发我。
判别式模型把每一个修改的地方都写出来,然后再把改后的完整小说贴出来,整个过程也就1秒。语言模型没办法比。而且我之前也试过大模型改错别字,缺点就是慢,而且会漏字,我才转而自己训练的。
2025年11月24日 01点11分
8
阿布阿奇🍭
最重要的是,我是在手机上运行代码的。
2025年11月24日 01点11分
level 7
接受的教育不允许这样
纽币!!!!
2025年11月24日 07点11分
9
level 7
阿布阿奇🍭
楼主
放一个训练日志。
数据比较少,再加上任务比较简单,所以模型训练几轮就收敛了。
2025年11月27日 03点11分
11
好好的大家在
请问这个控制台是自己做的吗
2025年12月28日 11点12分
阿布阿奇🍭
@好好的大家在
不,这是一个软件。
2025年12月28日 12点12分
好好的大家在
@阿布阿奇🍭
我也想要看看,请问可以告诉我软件名吗
2025年12月28日 14点12分
阿布阿奇🍭
@好好的大家在
Python编译器
2025年12月29日 00点12分
level 7
阿布阿奇🍭
楼主
另外大家说的那个关于小模型微调的建议我也看了,确实效果很不错,但是要分段输入,而且时间比较长。
因为我写小说我犯的错误也就那么一两个,所以需要高度个人化。小模型的速度与性能不符合我的需求。另外也有漏字的可能。
2025年11月27日 03点11分
12
level 7
阿布阿奇🍭
楼主
表现得最好的一版,验证损失和准确率降到最低。
2025年12月05日 07点12分
13
level 7
阿布阿奇🍭
楼主
任务太局部了,换成gru。速度更快,且表现几乎一样
2025年12月05日 23点12分
14
level 7
阿布阿奇🍭
楼主
加入了门控机制和平滑,门控对损失贡献的权重是0.2左右,可以让模型还能学到该不该改。误改率降低,准确率提升。
2025年12月12日 11点12分
15
阿布阿奇🍭
现在是当门控和主头都同意模型才会执行修改。
2025年12月12日 11点12分
level 7
阿布阿奇🍭
楼主
利用无障碍功能创建了一个悬浮窗,点击按钮就可以把打出的字快速修改,响应速度在毫秒级。实用性加了不少。
2025年12月15日 23点12分
16
1
2
尾页