TTS是Text To Speech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。 其中TTS语音模块使用起来最方便灵活,OTP语音芯片最简单。 本文将介绍一下科大讯飞的XFS5152CE语音合成模块。 XFS5152CE是一款高集成度的语音合成芯片,可实现中文、英文语音合成;并集成了语音编码、解码功能,可支持用户进行录音和播放;除此之外,还创新性地集成了轻量级的语音识别功能,支持30个命令词的识别。 手册说如果需要定制命令词需要跟厂家联系,我体验了一下,识别的准确率不是很高。 为了使用方便,我们可以直接购买现成的XFS5152CE语音合成模块。 XFS5152CE 芯片支持 UART 接口、I2C 接口、SPI 接口三种通讯方式,可通过 UART 接口、 I2C 或 SPI 接口接收上位机发送的命令和数据,允许发送数据的最大长度为 4K字节。 用户在使用语音编解码功能时(通讯接口必须选择 UART 接口,并且波特率设置为 115200bps),上位机发送启动编解码的命令给语音芯片,芯片内部的语音编解码模块把采集到的音频数据进行编码并通过UART接口实时传送给上位机,或者对上位机传送来的音频数据进行解码并实时播放出来。 PC上使用官方演示程序《科大讯飞语音合成芯片PC端演示程序》,使用串口通信进行测试的接线方式如下: 如果使用单片机与XFS5152CE语音合成模块联用,模块的8脚和10脚与STM32的串口交叉连接(我使用的是串口2),7脚用于判断语音模块当前的状态,原理图如下所示: 注意: 参考网文: 通过拨码开关设置波特率为:115200 /BSY引脚用于指示当前的工作状态,低电平代表Ready状态,高电平代表Busy状态。 控制标识需要按照语音合成命令的格式发送,控制标记作为文本进行合成,即合成命令是“帧头 + 数据区长度 + 合成命令字 + 文本编码格式 + 控制标记文本”的格式。 语音合成命令帧示例: XFS5152CE 芯片的语音合成功能支持多种文本控制标记,可以满足用户对语音合成发音人、音量、语速、语调等的设置。 文本控制标记的格式一般是半角中括号(即“[]”)内一个小写字母、一个阿拉伯数字,如: [m3]为使用女声的发音人小燕。 文本控制标记举例 [v5]:代表音量值,有效范围为:0~10; 微信公众号后台回复“XFS5152CE语音合成模块”,可以下载模块相关资料。 六月份的“每月一练”活动已经开始投票了,六月份做什么,由你们决定。 活动介绍及日程安排,详见公众号底部菜单栏“每月活动”。 若觉得本次的文章对您有帮助,随手、或转发,也是对我的支持。语音播报功能的实现方式
XFS5152CE语音合成模块
内置的30个语音识别命令词
如果需要语音识别功能,可以使用LD3320模块,参考网文:
LD3320语音识别模块:LDV7模块使用详解
如果需要录音模块,建议使用ISD系列录音芯片,参考网文:
简单好用的ISD1820语音录放芯片
通讯接口
接线方式
串口通信代码实现
1. 串口初始化
STM32F103 串口的使用方法uart2_init(115200);
2. 工作状态指示输出引脚初始化
用单片机的一个GPIO与之相连,可以读取该IO的输入状态,即可获取当前模块处于的工作状态。#define U5152_BSY GPIO_ReadInputDataBit(GPIOA,GPIO_Pin_0) void U5152_Init(void) { GPIO_InitTypeDef GPIO_InitStructure; RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOA,ENABLE); //U5152_BSY GPIO_InitStructure.GPIO_Pin = GPIO_Pin_0; //PA0 GPIO_InitStructure.GPIO_Mode = GPIO_Mode_IPU; //设置成上拉输入 GPIO_Init(GPIOA, &GPIO_InitStructure); //初始化GPIOA0 }
3. 封装播报语音函数
/*********************************************************** * 名 称: YS-XFS5051 文本合成函数 * 功 能: 发送合成文本到XFS5051芯片进行合成播放 * 入口参数: *HZdata:文本指针变量 * 出口参数: * 说 明: 本函数只用于文本合成,具备背景音乐选择。默认波特率9600bps。 * 调用方法:例: SYN_FrameInfo(“欢迎关注微信公众号:程序员小哈”); **********************************************************/ void XFS_FrameInfo(char *HZdata) { /****************需要发送的文本**********************************/ unsigned char Frame_Info[50]; //定义的文本长度 xdata unsigned int HZ_Length; HZ_Length =strlen(HZdata); //需要发送文本的长度 /*****************帧固定配置信息**************************************/ Frame_Info[0] = 0xFD ; //构造帧头FD Frame_Info[1] = 0x00 ; //构造数据区长度的高字节 Frame_Info[2] = HZ_Length+2; //构造数据区长度的低字节 Frame_Info[3] = 0x01 ; //构造命令字:合成播放命令 Frame_Info[4] = 0x01; //文本编码格式:GBK /*******************发送帧信息***************************************/ memcpy(&Frame_Info[5], HZdata, HZ_Length); USART2_OUT(Frame_Info,5+HZ_Length); //发送帧配置 }
4. 播报当前时间语音
while(U5152_BSY){} sprintf((char*)dtbuf,"[v5][s5][m55]当前时间为%02d时%02d分%02d秒",NowHour,NowMinute,NowSecond); XFS_FrameInfo((char*)dtbuf) ; delay_ms(10); while(U5152_BSY){}
5. 文本控制标记
sprintf((char*)dtbuf,”[v5][s5][m3]当前时间为%02d时%02d分%02d秒 rn”,NowHour,NowMinute,NowSecond);
[s5]:为语速值,取值范围为:0~10;
[m3]:选择发音人为小燕(女声)总结
资料获取
感兴趣的进入下面链接投票哈。
2020.06 “每月一练”活动开始投票了
欢迎评论中讨论,大家一起提高。
本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器 下载并得到。
ImovieBox网页视频下载器 下载地址: ImovieBox网页视频下载器-最新版本下载
本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.
阅读和此文章类似的: 全球云计算