欢迎来到全国技术转移公共服务平台！

北京

客服热线：010-83278899

微信公众号扫一扫关注我们

全部分类

您现在的位置： 首页 > 技术转让 > 一种语音浏览方法及浏览器

一种语音浏览方法及浏览器

专利类型：发明专利
有效期：不限
发布日期：2021-07-15
技术成熟度：详情咨询

交易价格： ￥面议

法律状态核实
签署交易协议
代办官方过户
交易成功

专利推荐

■ 装于音频接口的遥控发射装置

■ 一种四路机架服务器的散热系统

■ 基于动态优先级的总线仲裁器和动态改变优先级的方法

■ 一种SOC架构下的处理器核动态变频装置和方法

■ 一种多IO扩展接口的服务器主板装置

■ 一种内存访问信息实时捕获装置及访存信息捕获方法

■ 用于片上系统中知识产权核和功能模块的功耗降低方法

■ 语音和文本联合驱动的卡通人脸动画生成方法

■ 一种四路服务器主板

■ 一种基于人脸照片的卡通肖像生成方法

■ 一种多核处理系统及其管理方法

专利技术详情
专利技术附图
服务流程
过户资料

技术(专利)类型 发明专利
申请号/专利号 CN201110046896.3
技术(专利)名称 一种语音浏览方法及浏览器
项目单位 中国科学院计算技术研究所
发明人 邓铸辉;陈启华;王向东;钱跃良;林守勋
行业类别 物理
技术成熟度 详情咨询
交易价格 ￥面议
联系人 李志文
发布时间 2021-07-15

01

项目简介

本发明提供一种语音浏览方法，包括：网页信息提取步骤：对于用户请求的任一网页，首先对其进行网页分类，若判定该网页属于主题型网页，则对网页进行主内容抽取；若该网页为非主题型网页，则进行网页分块；网页格式转换步骤：将HTML格式的网页自动转换为VOICEXML格式的网页；其中，对于主题型网页，所抽取的网页主内容设置为优先向用户朗读；对于非主题型网页，为用户设置快捷键以使用户能够在各网页块之间自由切换和选择；语音推送步骤：基于voiceXML格式网页，向用户朗读网页内容。本发明还提供了相应的语音浏览器。发明能够使得网页内容的呈现更为合理和高效；发明能够使满足用户的实时请求。
展开
02

说明书

1.一种语音浏览方法，包括：网页信息提取步骤：对于用户请求的任一网页，首先对其进行网页分类，若判定该网页属于主题型网页，则对网页进行主内容抽取；若该网页为非主题型网页，则进行网页分块；网页格式转换步骤：将HTML格式的网页自动转换为VOICEXML格式的网页；语音推送步骤：基于voiceXML格式网页，向用户朗读网页内容。
2.根据权利要求1所述的语音浏览方法，其特征在于，所述网页格式转换步骤中，对于主题型网页，所抽取的网页主内容设置为优先向用户朗读；对于非主题型网页，为用户设置快捷键以使用户能够在各网页块之间自由切换和选择。
3.根据权利要求1所述的语音浏览方法，其特征在于，所述网页信息提取步骤中，网页分类的算法包括下列步骤：11)对网页进行DOM树解析，计算每一个DOM结点的链接文字比；12)对网页是否为主题型网页进行粗判断以将该网页判定为主题型网页、非主题型网页和网页类型待定的网页；13)根据步骤11)中得出的DOM树中各结点的链接文字比确定所述网页的最大内容结点；14)根据最大内容结点所占区域的位置判断该网页是否为主题型网页。
4.根据权利要求3所述的语音浏览方法，其特征在于，所述步骤12)包括：当DOM树根结点的链接文字比小于预设的第一阈值时，判定该网页为主题型网页，网页分类算法结束；当DOM树根结点的链接文字比大于预设的第二阈值时，判定该网页为非主题型网页，网页分类算法结束；当DOM树根结点的链接文字在所述第一阈值和所述第二阈值之间时，该网页类型待定，转入步骤3)。
5.根据权利要求3所述的语音浏览方法，其特征在于，所述步骤14)中，当最大内容结点所占区域的位置位于网页中心区域时，判定该网页为主题型网页，否则判定为非主题型网页。
6.根据权利要求5所述的语音浏览方法，其特征在于，网页的中心区域定义如下：如页面的坐标是(0，0，width，height)，其中(0，0)代表左上角坐标，(width，height)代表页面的右下角的坐标。width指页面的宽度，height指页面的高度，那么网页的中心区域为(0.25*width，0，0.75*width，0.5*height)；当最大内容结点所占区域与网页的中心区域有交集时，即判定最大内容结点所占区域的位置位于网页中心区域。
7.根据权利要求3所述的语音浏览方法，其特征在于，所述网页信息提取步骤中，主内容抽取的算法包括下列步骤：21)取最大内容结点所对应的DOM树片段，对该DOM树片段进行遍历，对该DOM树片段中的每个结点，如该结点包含的链接的个数大于预设的链接个数阈值，且该结点的链接文字比大于预设的链接文字比阈值，则判定该结点为噪音结点；否则判定为主内容结点；22)去除所有噪音结点，得到只含主内容结点的子结点集合。
8.根据权利要求2所述的语音浏览方法，其特征在于，所述网页信息提取步骤中，分块处理的算法包括下列步骤：31)获取待分块网页的DOM树；32)遍历所述DOM树，将其中每个只包含1个基本多行结点的结点作为一个基本分块，将每两个只包含1个基本多行结点的结点之间的零散叶结点分别合成一个基本分块；其中，当一个基本多行结点的父结点被作为一个基本分块时，该基本多行结点不再作为一个基本分块。
9.根据权利要求8所述的语音浏览方法，其特征在于，所述分块处理的算法还包括：33)在所述基本分块中找出主题块，将主题块与其后面邻接的若干个非主题块合并；所述主题块中包含主题或分类标签。
10.一种语音浏览器，包括：网页信息提取装置：用于对于用户请求的任一网页，首先对其进行网页分类，若判定该网页属于主题型网页，则对网页进行主内容抽取；若该网页为非主题型网页，则进行网页分块；网页格式转换装置：用于将HTML格式的网页自动转换为VOICEXML格式的网页；以及语音推送装置：用于基于voiceXML格式网页向用户朗读网页内容。
展开

专利技术附图

< >

服务流程

过户资料

买卖双方需提供资料
平台提供
过户后您将获得

买家
卖家

公司
企业营业执照
企业营业执照

专利注册证原件

个人
身份证

个体户营业执照
身份证

专利注册证原件

专利代理委托书

转让申请书

转让协议

手续合格通知书

专利证书

专利利登记簿副本

安全保障

品类齐全

海量资源库，平台整合几十万闲置资源。
交易保障

完善的资金保障体系确保买卖双方资金安全。
专人跟进

专业交易顾问全程服跟进,确保交易流畅。
快速响应

专业在线/电话客服服务，快速响应贴心服务。
售后无忧

资质过硬,国内大知识产权服务平台。

-我要咨询-

专利类型：

专利号：

联系人：

专利名称： *

联系电话： *

验证码：

报价：

摘要：

提交

一种语音浏览方法及浏览器

专利推荐

01

02

专利技术附图

服务流程

过户资料

安全保障

品类齐全

交易保障

专人跟进

快速响应

售后无忧

热门服务