凯迪微信公众号
扫描二维码关注
发现信息价值

微信扫一扫
分享此帖文

回帖人: | 只看此人 | 不看此人 | 2012/10/4 15:52:03    跟帖回复:
31
多此一举。

能阅读汉字的人对断词基本没困难,至少人工断词比机器断词靠谱得多。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 15:57:51   
32
转至第14楼第 14 楼 不敢思考A 2012/10/4 14:31:40 的原帖:     断开读起来还是有点不习惯 但是断开的表达更清晰 还有个弊端就是实行起来费空间 费纸.转至第15楼第 15 楼 cyberhorse 2012/10/4 14:41:53 的原帖: 谢谢!
 认为 “断开的表达更清晰”, 就可以 算作是基本认同 改革大方向的。 刚开始 肯定会存在 种种不足, 相信 一定会在 实践中慢慢克服 和完善的。 习惯 也慢慢会建立起来的。 费纸不是问题, 毕竟 电子化文本 是大趋势, 且人的精力 比纸张 更宝贵。


非常赞成 楼主的意见,我也有同感,

不过,我的意见是 将修饰词和被修饰词放在一起,而不是每个词都断。

例如,主语和主语的修饰词定语 放在一起,谓语和状语 放在一起,

短句少断,长句多断,且这样符合人说话的 停顿习惯,便于朗读。

 

就像上面我给你 重新断的那样。

 

这样写长句的时候,比较容易看懂,

特别是现在的科技词汇 都比较长,而精确描述的长句,可能一句话就有5行10行的。

 

而在网络上,发帖子 阐述简要观点,用我这样的隔行体更加清晰明了。


楼主的独立思考,确实很有价值,

 

比那些 “中国语言文字委员会”的老棺材瓤子,不知要强多少倍。

 

可惜的是,人才都在底层,

 

而掌握话语权、决定权的,都是些混吃等死、尸位素餐的老棺材瓤子。

 



此贴已经被作者于 2012/10/4 16:18:09 编辑过

回帖人: | 只看此人 | 不看此人 | 2012/10/4 15:59:18    引用回复:
33
转至第31楼第 31 楼 今夜未眠 2012/10/4 15:52:03 的原帖:多此一举。

能阅读汉字的人对断词基本没困难,至少人工断词比机器断词靠谱得多。


多此一举/vl 。/w

能/v 阅读/vn 汉字/n 的/ude1 人/n 对/p 断词/nz 基本/a 没/d 困难/an ,/w 至少/d 人工/b 断词/nz 比/p 机器/n 断词/nz 靠谱/nz 得/ude3 多/a 。/w

——————————————————————————————
机器/n 断词/nz 已经/d 有/vyou 很大/d 进步/vn ,/w 继续/v 发展/vn 有可能/nz 超过/v 一般/ad 人/n 的/ude1 断词/nz 。/


以上是机器断词

回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:03:11    跟帖回复:
34
机器断词:

非常/d 赞成/v 楼主/n 的/ude1 意见/n ,/w 我/rr 也/d 有/vyou 同感/n ,/w 

不过/c ,/w 我/rr 的/ude1 意见/n 是/vshi 将/d 修饰词/nz 和/cc 被/pbei 修饰词/nz 放在/v 一起/s ,/w 而/cc 不是/c 每个/r 词/n 都/d 断/v 。/w 

例如/v ,/w 主语/n 和/cc 主语/n 的/ude1 修饰词/nz 定于/v 放在/v 一起/s ,/w 谓语/n 和/cc 状语/n 放在/v 一起/s ,/w 

这样/rzv 写/v 长句/nz 的/ude1 时候/n ,/w 比较/d 容易/ad 看懂/nz ,/w 

特别/d 是/vshi 现在/t 的/ude1 科技/n 词汇/n 都/d 比较/d 长/a ,/w 而/cc 精确/a 描述/v 的/ude1 长句/nz ,/w 可能/v 一句话/l 就/d 有/vyou 5行/mq 10行/mq 的/ude1 。/w 


楼主/n 的/ude1 独立/a 思考/vn ,/w 确实/ad 很/d 有价值/nz ,/w 比/p 那些/rz “/w 中国语言文字委员会/nt ”/w 的/ude1 老/a 棺材瓤子/nz ,/w 不知/v 要强/a 多少/ry 倍/q 。/w 
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:04:45    引用回复:
35
转至第28楼第 28 楼 活水江河 2012/10/4 15:45:03  的原帖:耶宝/ntc 中文分词/nz 的/ude1 准确率/n 可达/nz 99.8%/m 。/w 

对/p 中外/b 人名/n 、/w 机构/n 名/q 有/vyou 很高/d 的/ude1 识别/vn 率/v 。/w 


http://www.yebol.com.cn/index.jsp


 看来 分词 工具 有不少。 但 这些 工具 主要是 面向 机器 翻译、 人工智能 方面的 研究 用的, 并不 适合 日常使用。 我 最初 想到 断词 问题, 就是 考虑到 机器翻译 过程中 中文 断词 是一个 绕不过去的 特色。 很多 网友 在 讨论 文字 优劣 问题 时, 很少涉及 思维概念 和 语言词汇的 关系, 促使 我 在 这方面 多 作了 一些 思考, 发现了 问题所在。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:06:05    跟帖回复:
36
断词后很容易发现错别字, 如下“定于” 应是“定语”

例如/v ,/w 主语/n 和/cc 主语/n 的/ude1 修饰词/nz 定于/v 放在/v 一起/s ,/w 谓语/n 和/cc 状语/n 放在/v 一起/s ,/w 
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:06:06    跟帖回复:
37
很好的想法,与楼主同感
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:12:50    引用回复:
38
转至第28楼第 28 楼 活水江河 2012/10/4 15:45:03 的原帖:耶宝/ntc 中文分词/nz 的/ude1 准确率/n 可达/nz 99.8%/m 。/w 

对/p 中外/b 人名/n 、/w 机构/n 名/q 有/vyou 很高/d 的/ude1 识别/vn 率/v 。/w 


http://www.yebol.com.cn/index.jsp


转至第35楼第 35 楼 cyberhorse 2012/10/4 16:04:45 的原帖: 看来 分词 工具 有不少。 但 这些 工具 主要是 面向 机器 翻译、 人工智能 方面的 研究 用的, 并不 适合 日常使用。 我 最初 想到 断词 问题, 就是 考虑到 机器翻译 过程中 中文 断词 是一个 绕不过去的 特色。 很多 网友 在 讨论 文字 优劣 问题 时, 很少涉及 思维概念 和 语言词汇的 关系, 促使 我 在 这方面 多 作了 一些 思考, 发现了 问题所在。
是的,现在的分词工具主要是为机器用的,但是算法和参数只要稍加修改,就可以为产生适合人使用的结果。

虽然有很多分词工具,但准确率达到99%以上的就很少了!


回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:20:53    引用回复:
39
转至第14楼第 14 楼 不敢思考A 2012/10/4 14:31:40 的原帖:     断开读起来还是有点不习惯 但是断开的表达更清晰 还有个弊端就是实行起来费空间 费纸.转至第15楼第 15 楼 cyberhorse 2012/10/4 14:41:53 的原帖: 谢谢!
 认为 “断开的表达更清晰”, 就 可以 算作 是 基本 认同 改革大方向的。 刚开始 肯定会 存在 种种不足, 相信 一定会 在 实践中 慢慢 克服 和 完善的。 习惯 也 慢慢 会 建立起来的。 费纸 不是 问题, 毕竟 电子化 文本 是 大趋势, 且 人的 精力 比 纸张 更 宝贵。
转至第32楼第 32 楼 gooble 2012/10/4 15:57:51  的原帖:
非常赞成 楼主的意见,我也有同感,

不过,我的意见是 将修饰词和被修饰词放在一起,而不是每个词都断。

例如,主语和主语的修饰词定于放在一起,谓语和状语放在一起,

这样写长句的时候,比较容易看懂,

特别是现在的科技词汇都比较长,而精确描述的长句,可能一句话就有5行10行的。


楼主的独立思考,确实很有价值,比那些 “中国语言文字委员会”的老棺材瓤子,不知要强多少倍。
 嗯, 目前 按 我设计的 空格断词 输入法, 分到 什么 程度 完全 可以 随心所欲。 在 “中国语言文字文员会” 没有 制定出 标准 前, 我们每个人 都是 标准 制定者, 呵呵。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:22:41    引用回复:
40
转至第37楼第 37 楼 gmhyzc 2012/10/4 16:06:06  的原帖:很好的想法,与楼主同感 谢谢支持!
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:24:24    引用回复:
41
转至第8楼第 8 楼 猫爪挠狗 2012/10/4 13:20:10  的原帖:觉得没那个必要转至第10楼第 10 楼 cyberhorse 2012/10/4 13:25:14  的原帖: 说一说 没有必要的 道理。断到什么程度有学问。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:26:36    跟帖回复:
42
有道理 ,至于间格 可以用 半角,间格 小一倍,这样就 不会 太 不习惯 和 浪费篇幅了。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:31:12    跟帖回复:
43
还有个 问题 就是 打字时 要 老是 按 空格键,这样 就 影响了 打字的 速度了。
回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:31:14    引用回复:
44
转至第8楼第 8 楼 猫爪挠狗 2012/10/4 13:20:10 的原帖:觉得没那个必要转至第10楼第 10 楼 cyberhorse 2012/10/4 13:25:14 的原帖: 说一说 没有必要的 道理。转至第41楼第 41 楼 偷取你的美丽 2012/10/4 16:24:24 的原帖:断到什么程度有学问。

不同粒度的断词:

美国有线电视新闻网 可为一词,或断为多词

[美国/nsf 有线电视/n 新闻网/n]/nz (/w CNN/x )/w 10月3日/t 报道/v ,/w 美国/nsf 2012/m 大选/vn 首场/n 辩论/vn 10月3日/t 晚间/t 结束/v ,/w 两党/nz 候选人/nnt 奥巴马/nrf 和/cc 罗姆尼/nrf 围绕/v 着/uzhe 就业/vn 、/w 税收/n 、/w 经济/n 、/w 医改/nz 、/w 联邦政府/nis 角色/n 及/cc 教育/vn 等/udeng 问题/n 展开/v 激辩/nz 。/w


 

回帖人: | 只看此人 | 不看此人 | 2012/10/4 16:32:15    引用回复:
45
转至第8楼第 8 楼 猫爪挠狗 2012/10/4 13:20:10 的原帖:觉得没那个必要转至第10楼第 10 楼 cyberhorse 2012/10/4 13:25:14 的原帖: 说一说 没有必要的 道理。转至第41楼第 41 楼 偷取你的美丽 2012/10/4 16:24:24 的原帖:断到什么程度有学问。

不同粒度的断词:

美国有线电视新闻网 可为一词,或断为多词

[美国/nsf 有线电视/n 新闻网/n]/nz (/w CNN/x )/w 10月3日/t 报道/v ,/w 美国/nsf 2012/m 大选/vn 首场/n 辩论/vn 10月3日/t 晚间/t 结束/v ,/w 两党/nz 候选人/nnt 奥巴马/nrf 和/cc 罗姆尼/nrf 围绕/v 着/uzhe 就业/vn 、/w 税收/n 、/w 经济/n 、/w 医改/nz 、/w 联邦政府/nis 角色/n 及/cc 教育/vn 等/udeng 问题/n 展开/v 激辩/nz 。/w


 

72603 次点击,558 个回复  1 2 3 4 5 6 7 8 9 10 ... 38 下一页
跳转论坛至:
快速回复:[原创]论中文引入空格符断词的必要性
本站声明:本站BBS互动社区的文章由网友自行帖上,文责自负,对于网友的贴文本站均未主动予以提供、组织或修改;本站对网友所发布未经确证的商业宣传信息、广告信息、要约、要约邀请、承诺以及其他文字表述的真实性、准确性、合法性等不作任何担保和确认。因此本站对于网友发布的信息内容不承担任何责任,网友间的任何交易行为与本站无涉。任何网络媒体或传统媒体如需刊用转帖转载,必须注明来源及其原创作者。特此声明!

【管理员特别提醒】 发布信息时请注意首先阅读 ( 琼B2-20060022 ):
1.全国人大常委会关于维护互联网安全的决定2.凯迪网络BBS互动区用户注册及管理条例。谢谢!
  • 广告