在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称(OpenSource Name):LinXueyuanStdio/Data-for-LaTeX_OCR开源软件地址(OpenSource Url):https://github.com/LinXueyuanStdio/Data-for-LaTeX_OCR开源编程语言(OpenSource Language):开源软件介绍(OpenSource Introduction):LaTeX OCR 的数据仓库本数据仓库是专为 LaTeX_OCR 及 LaTeX_OCR_PRO 制作的数据,来源于 数据集本仓库暂时有 4 个数据集
目录结构规范每个数据集务必按以下结构来 small
├── formulas
│ ├── train.formulas.norm.txt 规范化后的公式,以空格为分隔符直接构造字典
│ ├── test.formulas.norm.txt
│ ├── val.formulas.norm.txt
│ └── vocab.txt 根据公式文件 XXX.formulas.norm.txt 构建的字典
├── images
│ ├── images_train 图片目录
│ ├── images_test
│ └── images_val
├── matching
│ ├── train.matching.txt 样式为 <image.png>, <formulas_id> 的匹配文件
│ ├── test.matching.txt
│ └── val.matching.txt
├── data.json
├── vocab.json
└── README.md 注意 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论