您当前的位置:首页 > IT编程 > python
| C语言 | Java | VB | VC | python | Android | TensorFlow | C++ | oracle | 学术与代码 | cnn卷积神经网络 | gnn | 图像修复 | Keras | 数据集 | Neo4j | 自然语言处理 | 深度学习 | 医学CAD | 医学影像 | 超参数 | pointnet | pytorch | 异常检测 | Transformers | 情感分类 | 知识图谱 |

自学教程:Python3.7 + Yolo3实现识别语音播报功能

51自学网 2022-02-21 10:37:27
  python
这篇教程Python3.7 + Yolo3实现识别语音播报功能写得很实用,希望能帮到您。

一、利用Python调用系统win10的文字转语音

首先下载需要用到的库:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下来直接上代码:

import win32com.client as win# SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎,从而实现朗读功能speak = win.Dispatch("SAPI.SpVoice")# 完成将文本信息转换为语音并按照指定的参数进行朗读。# 该方法有Text和Flags两个参数,分别指定要朗读的文本和朗读方式(同步或异步等)。speak.Speak("come on")speak.Speak("你好")

最后运行代码,就会听到系统传出来的声音,读出了 come on 和 你好。

二、开始使用Yolo识别,利用语音播报返回出来

开始之前我们先得解析出来Yolo3的代码,从而获取到被识别出来的物体标签。

首先我们找到一个coco_classes.txt,发现里面有很多的英文单词,这些就是准备识别匹配的标签了。

在这里插入图片描述

然后我们在找到yolo.py,发现的我们的coco_classes.txt被传入进来了

在这里插入图片描述

关键的来了,我们通过Ctrl + F 搜索一下classes_path这个Key,发现这几行代码

在这里插入图片描述

这里就是读取了存放标签的那个文本,进行了处理,并且返回了名字。

最后找到这一行代码,此处代码就是一开始进行识别的时候,我们的控制台打印出来的代码。

在这里插入图片描述

运行代码的时候发现,打印的这个label,就是识别出的物体的标签了。

这个时候我们就可以将我们的语音播报的代码添加进行,把label传入进去,就会发现识别出来的物体就会通过语音返回。

在这里插入图片描述

Time~

到此这篇关于Python3.7 + Yolo3识别 语音播报的文章就介绍到这了,更多相关Python识别语音内容请搜索51zixue.net以前的文章或继续浏览下面的相关文章希望大家以后多多支持51zixue.net!


Python与数据库的交互问题小结
Python实现免费音乐下载器
万事OK自学网:51自学网_软件自学网_CAD自学网自学excel、自学PS、自学CAD、自学C语言、自学css3实例,是一个通过网络自主学习工作技能的自学平台,网友喜欢的软件自学网站。