立即咨询

电话咨询

微信咨询

立即试用
商务合作

在Gazebo仿真环境中实现ROS机器人的语音识别和自主导航综合

2022-11-21

 

没有机器人,如何学习ROS

最近新冠疫情又出现反复,不少同学返校受阻,好几个月时间没摸过实验室的机器人了,心中难免惆怅。这一次带大家体验一下,在没有实体机器人的情况下,怎么折腾一台听人使唤的虚拟机器人。

[实验目标]

  • 使用语音识别引擎,识别语音指令

    (“Go to the kitchen”)

  • 机器人按照语音指令,执行相应的任务

    (自主导航到“kitchen”这个航点)

  • 实验程序结构:

[实验准备]

ROS Kinetic (Ubuntu 16.04)

cd ~/catkin_ws/src/
git clone https://github.com/6-robot/wpr_simulation.git
git clone https://github.com/6-robot/wpb_home.git
git clone https://github.com/6-robot/xfyun_kinetic.git
cd ~/catkin_ws/src/wpr_simulation/scripts
./install_for_kinetic.sh
cd ~/catkin_ws/src/wpb_home/wpb_home_bringup/scripts
./install_for_kinetic.sh

ROS Melodic (Ubuntu 18.04)

cd ~/catkin_ws/src/
git clone https://github.com/6-robot/wpr_simulation.git
git clone https://github.com/6-robot/wpb_home.git
git clone https://github.com/6-robot/xfyun_kinetic.git
cd ~/catkin_ws/src/wpr_simulation/scripts
./install_for_melodic.sh
cd ~/catkin_ws/src/wpb_home/wpb_home_bringup/scripts
./install_for_melodic.sh

[实验步骤]

1、首先,新建一个ROS源码包Package。

在Ubuntu里打开一个终端程序,输入如下指令:

                                                                                         cd catkin_ws/src/                                                                          

按下回车之后,即可进入ROS工作空间,然后输入如下指令新建一个ROS源码包:

                                                             catkin_create_pkg sr_pkg roscpp std_msgs                                                                    

这条指令的具体含义是:

指令

含义

catkin_create_pkg

创建ROS源码包(package)的指令

sr_pkg

新建的ROS源码包命名

roscpp

C++依赖项,本例程使用C++编写,所以需要这个依赖项

std_msgs

标准消息依赖项,语音识别结果使用其中的String数据格式

按下回车键后,可以看到如下信息,表示新的ROS软件包创建成功。

在VSCode中,可以看到工作空间里多了一个sr_pkg文件夹,在其src子文件夹上右键点击鼠标,选择“New File”新建一个代码文件。

新建的代码文件,咱们为其命名为“sr_node.cpp”。

命名完毕后,在IDE的右侧可以开始编写sr_node.cpp的代码,其内容如下:

#include

#include

static ros::Publisher nav_pub;

void SRCallback(const std_msgs::String::ConstPtr & msg)

{ROS_WARN("[SRCallback] - %s", msg->data.c_str());

    int nFindIndex = 0;

    nFindIndex = msg->data.find("kitchen");

    if (nFindIndex >= 0)

   {  std_msgs::String nav_msg;

        nav_msg.data = "kitchen";

        nav_pub.publish(nav_msg); }

int main(intargc, char** argv)

    ros::init(argc, argv, "demo_sr_navigation");

    ros::NodeHandle n;

    nav_pub = n.advertise("/waterplus/navi_waypoint", 10);

    ros::Subscriber sr_sub = n.subscribe("/xfyun/iat", 10, SRCallback);

    ros::spin();

    return 0;

(1)代码的开头include了两个头文件:ros.h是ros的系统头文件;String.h是字符串类型头文件,程序中语音识别结果需要用到这个字符串格式。

(2)程序开头定义了一个nav_pub对象,这个是导航目标的消息发布者。

(3)接下来定义一个回调函数void SRCallback(),用来处理xfyun_waterplus节点发来的语音识别结果消息包。

(4)回调函数void SRCallback()的参数msg是一个std_msgs::String格式指针,其指向的内存区域就是存放语音识别结果的内存空间。msg包里包含了一个data成员,这是一个String格式的对象,里面装载的就是语音识别结果字符串。咱们使用ROS_WARN将这个字符串内容显示在终端程序窗口里。

(5)使用msg->data字符串的函数find()在语音识别结果里搜索“kitchen”这个关键词,如果该函数返回值大于0,说明识别结果里包含这个关键词。咱们将目标航点“kitchen”通过nav_pub发布给导航插件,执行导航任务。

(6)在主函数main()中,调用ros::init(),对这个节点进行初始化。

(7)定义一个ros::NodeHandle节点句柄n,并使用这个句柄向ROS核心节点发布一个std_msgs::String类型的主题,主题名为“/waterplus/navi_waypoint”,负责导航的地图插件会从这个主题里读取咱们发送的目标航点名称并执行导航任务。接下来订阅Topic主题“/xfyun/iat”,回调函数设置为之前定义的SRCallback()。这个“/xfyun/iat”是xfyun_waterplus进行语音识别后发布结果的主题名,咱们自己写的这个节点sr_node只需要订阅它就能收到最终的语音识别结果。

(8)调用ros::spin()对main()函数进行阻塞,保持这个节点程序在接收到语音识别结果前不会结束退出。

代码编写完毕后,需要按下键盘快捷键Ctrl+S进行保存,代码上方的文件名右侧的小白点会变成“×”,说明保存文件成功。

接下来,还需要将节点源码文件添加到编译文件里才能进行编译。编译文件在sr_pkg的目录下,文件名为“CMakeLists.txt”,在VSCode界面左侧点击该文件,右侧会显示文件内容。在 “CMakeLists.txt”文件末尾,为obj_node.cpp添加新的编译规则。内容如下:

  add_executable(sr_node

  src/sr_node.cpp

)

add_dependencies(sr_node ${${PROJECT_NAME}_EXPORTED_TARGETS} ${catkin_EXPORTED_TARGETS})

target_link_libraries(sr_node

  ${catkin_LIBRARIES}

)


同样,修改完需要按下键盘快捷键Ctrl+S进行保存,代码上方的文件名右侧的小白点会变成“×”,说明保存文件成功。下面开始进行代码文件的编译操作,启动一个终端程序,键入如下命令进入ROS的工作空间:

                                                                                               cd catkin_ws/                                                                                

然后再执行如下命令开始编译:

                                                                                             catkin_make                                                                                   

 

执行这条指令之后,会出现滚动的编译信息,直到出现“[100%] Built target sr_node”信息,说明新的sr_node节点已经编译成功。

2、下面咱们需要启动运行这个sr_node节点的虚拟仿真环境,具体步骤可以参看之前的实验:

《waterplus_map_tools开源的地图导航插件实验》

按照其中的实验步骤完成三个任务:

  • 通过SLAM构建环境地图。

  • 设置好包括“kitchen”在内的多个航点。

  • 启动地图插件,设置好机器人的初始位置。

3、运行我们编写的sr_node节点,让其与地图导航插件完成连接,并开始监听语音识别结果。打开一个新的终端程序,输入以下指令:

rosrun sr_pkg sr_node

回车执行,sr_node节点就启动起来了。

4、最后启动语音识别节点,由于语音识别功能使用的是科大讯飞的云服务,所以需要电脑连接到互联网,以便其与讯飞的云服务器建立数据连接。确认已经连接互联网后,打开一个新的终端程序,输入以下指令:

                              roslaunch xfyun_waterplus iat_en.launch                     

回车执行,科大讯飞的语音识别引擎便开始启动。此时可以听到电脑有节奏的发出“嘟~”的提示音,这是语音识别开始的信号。我们需要在两次“嘟”的提示音之间将要识别的话说给机器人听,它才能够正确的识别。在“嘟”的一声之后对电脑麦克风说“Go to the kitchen”,电脑识别完毕后,会将识别结果显示在终端程序里。

这时查看运行sr_node的终端,可以看到回调函数接收到的语音识别结果。

再切换到Rviz和Gazebo仿真环境,可以看到机器人开始自主导航到“kitchen”航点。

[扩展练习]
实验中的语音识别引擎还能识别中文指令,只是启动指令需要换成:

                                                                       roslaunch xfyun_waterplus iat_cn.launch                                                             

节点sr_node的代码同学们可以尝试进行相应的修改,最后别忘了caktin_make编译再运行。

 

 

更多产品了解

欢迎扫码加入云巴巴企业数字化交流服务群

产品交流、问题咨询、专业测评

都在这里!

 

热门数字化产品

快书编标系统快书编标系统强大易用的专业编标工具,让零基础的人也可以快速上手,轻松完成标书制作。专属企业的编标机器人,企业内部资源共享,有序管理,形成私有且易于管理的企业资源库。快书编标帮助个人提升工作效率,帮助企业实现业绩持续增长,为社会创造更多价值。
晨科布草管理系统晨科布草管理系统,为酒店布草洗涤管理提供从交接、跟踪、生命周期管理等流程;批量扫描识别,使用方便快捷,提高工作效率和经济效益,节约人员费用支出,降低成本;记录客户资料及洗衣统计,生成各类报表,可随时查询和打印信息。
腾讯电子签腾讯电子签是一款为企业及个人提供安全、便捷的电子合同签约及证据保存服务的产品。 您可以在实名认证的前提下,与约定方完成线上签约,并将签约过程进行存证保全以确保签约公信力。 腾讯电子签致力于降低您的运营成本,提升多端签署效率。
Zoho Projects项目管理软件Zoho Projects项目管理软件,帮助您轻松地进行项目规划、进度跟踪、内外协作。它利用工时统计、Bug管理、项目知识库管理等功能,帮助您实现业务目标。为您的项目管理工作提供全面综合的解决方案,从而帮助您和您的企业大幅创造价值。
快麦ERP电商系统快麦ERP电商系统,多平台、多渠道、多店铺统一管理,支持销售订单、库存、售后订单等自动同步,实现仓库无纸化办公,仓库规划及工作流程梳理,员工绩效全方位统计,财务、报表多维度统计。
为你推荐
2025腾讯产业合作伙伴大会|云巴巴荣获双项大奖,载誉而归

1月16日,2025腾讯产业合作伙伴大会在三亚召开。云巴巴,荣膺“2024腾讯云卓越合作伙伴奖—星云奖”和“2024腾讯云AI产品突出贡献奖”双项大奖

2025-01-17
直播平台项目管理工具选型指南来了!腾讯TAPD自动化+数据化驱动项目落地

直播平台项目管理工具选型指南来了!腾讯TAPD自动化+数据化驱动项目落地

2025-06-30
企业知识管理升级必看!腾讯乐享AI知识库的四大核心优势解析

企业知识管理升级必看!腾讯乐享AI知识库的四大核心优势解析

2025-06-30
制造业为何选择蓝巨人AGV?解析72小时柔性改造背后的三维技术革新

制造业为何选择蓝巨人AGV?解析72小时柔性改造背后的三维技术革新

2025-06-27
广告产研协同工具怎么选?TAPD 3个关键指标 打通敏捷协作全流程

广告产研协同工具怎么选?TAPD 3个关键指标 打通敏捷协作全流程

2025-06-27
查看更多