![AI源码解读:数字图像处理案例(Python版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/118/44510118/b_44510118.jpg)
上QQ阅读APP看书,第一时间看更新
AI源码解读.数字图像处理案例:Python版
4.3.4 文本数据翻译与爬虫
本部分包括文本数据翻译和爬虫。
1.文本数据翻译
数据集中类别名称为英文,需要将其转换为中文,在翻译过程中使用百度翻译API。
![](https://epubservercos.yuewen.com/631FC2/23721638301028906/epubprivate/OEBPS/Images/Figure-P135_24652.jpg?sign=1739986576-6JUcCnLENcrTnMK6aJ0KsdBjv573lCdv-0-99a657f035863bd809ad3d41b9cce967)
2.爬虫
在实现输出狗狗百科和论坛网页的过程中,使用beautifulsoup和lxml的网络爬虫方法,将狗狗名称和对应的百科网站url、论坛网站url格式化存储在dogurls2.csv文件中,参考地址为http://www.boqii.com/pet-all/dog/?p=1。
![](https://epubservercos.yuewen.com/631FC2/23721638301028906/epubprivate/OEBPS/Images/Figure-P136_24656.jpg?sign=1739986576-Uf1MP7bjiaOWxEx6vfwoVZydE1vGTi3I-0-811c6bc8e16f89944ad252738689ba39)
通过Pandas库中函数data.head()查看dogurls2.csv前5行,信息输出如图4-5所示。
![](https://epubservercos.yuewen.com/631FC2/23721638301028906/epubprivate/OEBPS/Images/Figure-P136_8629.jpg?sign=1739986576-qGcSryYcyTzYmjewinr25N4tqyTLaBj9-0-61d91d6357ed27abcbdec3755807dd92)
图4-5 dogurls2.csv文件前5行信息