在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称(OpenSource Name):qs956/Latex_OCR_Pytorch开源软件地址(OpenSource Url):https://github.com/qs956/Latex_OCR_Pytorch开源编程语言(OpenSource Language):Python 100.0%开源软件介绍(OpenSource Introduction):Latex_OCR_Pytorch 主要是这个版本的Pytorch实现: 感谢@LinXueyuanStdio 的工作以及指导.本项目与上述项目思路一致,但在实现上修改了一些地方:
Follow these paper: Follow these tutorial: 环境
数据使用LinXueyuanStdio/Data-for-LaTeX_OCR 数据集,原仓库较大,后续提供打包下载. 已包括上述仓库中small数据集 印刷体数据全集百度云 提取码:tapj Google Drive 自己划分的混合CROHME2011,2012数据集Google Drive 训练模型在自己划分CROHME2011,2012数据集上使用以下参数的训练模型Google Drive emb_dim = 30 attention_dim = 128 decoder_dim = 128 后续补充模型测试结果以及colab 数据格式数据集文件生成参考utils.py的get_latex_ocrdata 数据集文件json格式,包括训练集文件,验证集文件,字典文件. 字典格式: python字典(符号——编号)的json储存 数据集格式:
图片预处理 参考dataloader/data_turn主要进行以下操作
To do
|
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论