level 1
Mrcrius
楼主
最近接了个AI项目,急需一批高质量的人工编写中文复杂prompt指令数据,找了好久都没合适的,只能来贴吧求助神通广大的吧友们了!
先给大家说说具体需求,要是有资源或者知道哪里能搞到的,一定要联系我!
1.指令必须人工编写:不要模型生成的!必须是实打实的人工编写,而且得是复杂指令,得包含思维链。就像你得告诉模型 “先干啥,再干啥,为啥这么干”,这样模型才能顺着你的思路产出准确结果。
2.指令类型要丰富:生产类指令、检索类指令、摘要类指令、提取类指令等等都要,最好各种指令数量差不多,雨露均沾。
3.数据量级:几十万到百万条,量大价好说!
4.数据格式:必须是 jsonl 格式,每个数据字段要有 prompt(指令内容)、推理过程(详细写清楚怎么得出答案的)、答案(准确的结果)、指令类型(标明是生产类还是其他类型)。要是有公式,一定得转成 latex 格式!
5.准确率:答案准确率必须大于 98%,差一点都不行,质量就是生命线!
6.其他要求:数据内容得完整,逻辑得连贯,不能有重复的。也别整那些花里胡哨的 html 字符、特殊字符、乱码啥的,干干净净清清爽爽最好!
有资源的大佬欢迎随时联系我!咱们可以详谈合作方式和报酬,价格好商量,只要数据质量过硬,绝对不让你白忙活
拜托各位吧友帮忙转发扩散,要是能促成合作,必有重谢!!!
2025年06月05日 09点06分
1
先给大家说说具体需求,要是有资源或者知道哪里能搞到的,一定要联系我!
1.指令必须人工编写:不要模型生成的!必须是实打实的人工编写,而且得是复杂指令,得包含思维链。就像你得告诉模型 “先干啥,再干啥,为啥这么干”,这样模型才能顺着你的思路产出准确结果。
2.指令类型要丰富:生产类指令、检索类指令、摘要类指令、提取类指令等等都要,最好各种指令数量差不多,雨露均沾。
3.数据量级:几十万到百万条,量大价好说!
4.数据格式:必须是 jsonl 格式,每个数据字段要有 prompt(指令内容)、推理过程(详细写清楚怎么得出答案的)、答案(准确的结果)、指令类型(标明是生产类还是其他类型)。要是有公式,一定得转成 latex 格式!
5.准确率:答案准确率必须大于 98%,差一点都不行,质量就是生命线!
6.其他要求:数据内容得完整,逻辑得连贯,不能有重复的。也别整那些花里胡哨的 html 字符、特殊字符、乱码啥的,干干净净清清爽爽最好!
有资源的大佬欢迎随时联系我!咱们可以详谈合作方式和报酬,价格好商量,只要数据质量过硬,绝对不让你白忙活
拜托各位吧友帮忙转发扩散,要是能促成合作,必有重谢!!!