X为了获得更好的用户体验,请使用火狐、谷歌、360浏览器极速模式或IE8及以上版本的浏览器
关于我们 | 帮助中心
欢迎来到东莞市创新创业人才及知识产权交易服务平台,请 登录 | 注册 | 管理中心
尊敬的 , 欢迎光临!  [会员中心]  [退出登录]
当前位置: 首页 >  科技成果  > 详细页

[00287966]一种MapReduce并行化大数据文本分类方法

交易价格: 面议

所属行业: 网络

类型: 发明专利

技术成熟度: 正在研发

专利所属地:中国

专利号:201510297189.X

交易方式: 完全转让

联系人: 刘姣姣

进入空间

所在地:陕西西安

服务承诺
产权明晰
资料保密
对所交付的所有资料进行保密
如实描述

技术详细介绍

一种MapReduce并行化大数据文本分类方法,包括如下步骤:第一步:建立用于文本分类的基准测试数据集,进行数据预处理,包括分词、去停用词、词根还原;将该基准测试数据集随机划分为训练文本和测试文本,将所述基准测试数据集采用向量空间模型建立文本表示模型;第二步:根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择;第三步:采用贝叶斯分类器对所述基准测试数据集进行训练学习,得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。

推荐服务:

copyright © 2016    www.dgiptts.com    all rights reserved

运营商:东莞市松山湖高新区科技服务有限公司    技术支持:科易网

电话:0769-22890323 ,0769-22892161    地址:松山湖控股大厦715室

线下服务大厅地址:松山湖科技十路联合金融15栋(东莞市创新创业人才服务中心)1楼

粤ICP备16038699号-1

在线客服系统