python小工具合集含图片、语音识别、翻译pdf等

行业软件 2020-04-03 21:18:10

需求分析：

1、音频转文字：目前市面上的音频转文字大多收费。音频转文字的需求是：上传一段音频，直接识别成文字，对于会议记录的比较好使，注意不是实时的语音识别。

2、文字转语音：转的语音不要太生硬。

3、截图文字识别（OCR）：截屏完成即可弹出截图所含图片中的文字。

4、批量图片文字识别：选择多张图片，直接识别出每张图片的文字。

5、复制翻译：看英文文献，有时候懒，如果能有置顶悬浮窗，实时监测剪切板，遇到想要翻译的段落，直接复制，即可给出多国语言翻译结果也是刚需；当然有些论文文本不能复制，所以还复用了截图OCR的功能，对OCR结果进行翻译。

6、图种制作：这个不入流，纯属个人爱好，没啥技术含量。

上一篇文件MD5值批量修改工具及原理解析C#版

下一篇 C#编程笔记本MYSQL版本开源

网站导航

网站导航

随机推荐

python小工具合集含图片、语音识别、翻译pdf等