-
Notifications
You must be signed in to change notification settings - Fork 176
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
关于数据格式 #228
Comments
两种数据最终都要转成 qa , 也就是两种数据内容形式都可以, 数据结构是qa 即可。 |
格式1:{"id": 1, "paragraph": [{"q": "下面是一个指令,描述了一个任务。编写适当的输出完成请求。\n\n### 指令:\n给出三个保持健康的提示。\n\n### 响应:", "a": ["1.饮食要均衡,确保包括足够的水果和蔬菜。\n2.定期运动以保持身体活跃和强壮。\n3.保持充足的睡眠并保持一致的睡眠时间表。"]}]} 格式2:| | 意思是这两种都可?说白了区别就是多了一些提示词 |
是的。 |
不好意思,还是想问一下。我用alpaca2qa.py把alpaca的数据集转成所需格式。比如:{ 有两个问题: |
|
1.所以按着alpaca2qa.py文件转出来的中文语料是可以用的?:{"id": 1, "paragraph": [{"q": "下面是一个指令,描述了一个任务。编写适当的输出完成请求。\n\n### 指令:\n给出三个保持健康的提示。\n\n### 响应:", "a": ["1.饮食要均衡,确保包括足够的水果和蔬菜。\n2.定期运动以保持身体活跃和强壮。\n3.保持充足的睡眠并保持一致的睡眠时间表。"]}]} |
data路径下,有两个py文件,其中一个是把alpaca转为qa:比如:{"id": 1, "paragraph": [{"q": "下面是一个指令,描述了一个任务。编写适当的输出完成请求。\n\n### 指令:\n给出三个保持健康的提示。\n\n### 响应:", "a": ["1.饮食要均衡,确保包括足够的水果和蔬菜。\n2.定期运动以保持身体活跃和强壮。\n3.保持充足的睡眠并保持一致的睡眠时间表。"]}]}
我想问,你给出的例子中是没有——下面是一个指令,描述了一个任务。编写适当的输出完成请求以及\n\n###这些符号,想问问要用哪个数据格式???
The text was updated successfully, but these errors were encountered: