Xournal++ HTR
Xournal++ HTR 是为 Xournal++ 开发的手写文本识别(HTR)插件。它的主要目的是通过手写文本识别技术,使手写笔记变得可搜索,从而解决手写笔记缺乏可搜索性的问题。
使用场景
- 数字笔记记录:用户可以直接在 Xournal++ 中书写手写笔记,然后通过 HTR 插件将这些手写内容转换为可搜索的文本,提高笔记管理的效率。
- 教育和研究:适用于教育工作者和学生,用于快速记录和查找课堂笔记、研究资料等。
- 会议记录:在商务会议中,可以用于记录手写笔记,并通过文本识别功能快速搜索关键内容。
- 创意工作:设计师、艺术家等可以用手写方式记录灵感,然后通过插件转换为文本,便于后续的编辑和分享。
安装步骤
- 创建 Python 环境并激活:
conda create --name xournalpp_htr python=3.10.11
,conda activate xournalpp_htr
。 - 安装 HTRPipeline 包和项目依赖:按照 HTRPipeline 的安装指南,然后执行
pip install -r requirements.txt
。 - 开发模式安装该包:
pip install -e .
。 - 将
plugin/
文件夹的内容移动到 Xournal++ 配置路径下的plugins/xournalpp_htr/
。
项目设计
Xournal++ HTR 项目采用了 Lua 插件和 Python 后端架构。Lua 插件集成在 Xournal++ 中,调用 Python 后端进行手写文本的转录。当前的概念1使用了计算机视觉算法,检测页面上的单词并进行识别。未来的改进可能包括:
- 重新训练算法以适应 Xournal++ 的数据。
- 使用语言模型改善文本编码。
- 利用 online HTR 算法发展序列到序列模型。
贡献与社区
项目采用 master
> dev
> feature branches
的分支策略,确保 master
分支的稳定。开发新功能时会在 dev
分支完成,具体功能的开发则在独立的功能分支进行。
总而言之,Xournal++ HTR 项目旨在为 Xournal++ 用户提供本地化的开源手写识别功能,使其手写笔记更加智能和高效。
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621