凯迪微信公众号
扫描二维码关注
发现信息价值

微信扫一扫
分享此帖文

发帖人:
cyberhorse
 |  只看此人
   楼主
收藏
收藏成功
添加
添加标签来管理你的收藏吧!
| 刷新 | 字体缩小 | 字体变大
[原创]论中文引入空格符断词的必要性
73032 次点击
558 个回复
cyberhorse 于 2012/10/4 11:17:08 发布在 凯迪社区 > 猫眼看人
 历史上 中文古文 是没有标点符号的。 文章阅读者 需 付出额外的 精力 专注于断句, 且 稍有差池 便会造成 误读。 所谓 失之毫厘,差之千里。 引入标点符号 是 一次重大的文字改革, 使得汉字文本的 阅读效率 有了 很大的提高。 但 中文的改革之路 才刚刚起步, 远未达到 尽善尽美的程度。 至少在 阅读效率方面 仍然 存在着一个 显而易见的 障碍—— 断词。


 语言的最小单位 是 词, 不是 (汉字才有的)字。语言 是 思维的表达工具, 而 思维的要素 是 概念 和 逻辑。 关于概念的定义: “概念(Idea;Notion;Concept)是 反映 对象的 本质属性的 思维形式。人类 在 认识过程 中,从 感性认识 上升到 理性认识, 把 所感知的 事物的 共同本质特点 抽象出来, 加以概括, 就 成为概念。 表达概念的 语言形式 是 词 或 词组。 概念 都有 内涵 和 外延, 即 其 涵义 和 适用范围。 概念 随着 社会历史 和 人类认识的 发展而变化。 中华人民共和国国家标准GB/T 15237.1—2000: ‘概念’ 是 对 特征的 独特组合 而形成的 知识单元。 德国工业标准2342 将 概念 定义为 一个 ‘通过 使用 抽象化的 方式 从 一群事物中 提取出来的 反应 其 共同特性的 思维单位’。”(摘自http://baike.baidu.com/view/45333.htm

 语言文字的 发展 一般 总是 趋向 越来越 简化。 汉字 经 长期 演化 发展, 逐渐形成了 一词 一字, 一字一音。所以 古代中文 基本上是 字 即 词。 对于 古代社会 来说, 发展缓慢, 概念稀少, 几万个字(词) 也许足以应付了。 进入近现代, 文化发展 大大加快, 知识 概念 呈爆炸式增长。 几万个字(词) 已经 入不敷出, 捉襟见肘。 现在大量的词 是 由两个汉字组成的, 也就是说 汉语 正在转向 多音节词汇的 方向 发展。


  然而, 记录 汉语的 汉字文本 却 还是 以字为基本单位的 方式 书写, 实际上就是字词不分。 这样 既 阻碍了 汉语的 发展; 又 不利于 阅读效率的 提高;  同时 也 造成了 普遍的 望文生义, 不求甚解, 概念模糊 等 思维习惯。 中文句子中 词汇之间 没有明显的界限, 区分词汇 全靠 习惯 和 经验, 常常会 因此而 发生误读。 比如:“杭州市长春药店”, 单从 字面 来说, 可以 有两种不同的 断词法, 得到 两种 不同意思。 另一方面, 这种 断词 分析 过程 是 必须 付出 一定的 精力的。 一份经 插入空格 显式区分 词汇的 文本, 阅读起来 明显感觉 轻松许多。


 为了 适应 现代社会 对 语言 文字的 发展 要求; 为了符合语言的基本规律, 使 词 回归 为 语言的 基本单位; 为了 提高 阅读 效率, 降低 误读 概率; 更为了 避免 因 随意组词 而造成的 望文生义、 概念模糊 等不利于 抽象思维的 习惯……; 总之, 是到了 该提倡 引入 空格断词 的时候了!


此贴已经被作者于 2012/10/4 11:26:43 编辑过

分享: 分享到新浪微博 分享到腾讯微博 分享给朋友
凯迪社区APP下载

优秀帖文推荐

    回复 | 引用 | 举报
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 11:58:39    跟帖回复:
       沙发
    赞同!
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 12:05:01    跟帖回复:
       第 3
     工欲善其事,必先利其器。光说不练假把式。 以下 提供 阅读 和 书写 两个方面的 利器。
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 12:05:20   
       第 4

     这是 RUSHRUSHZOO 推荐 一款 将 文本 分词的 软件。

    大家看看对一篇网络文章的分词效果,能提高阅读速度。”

    官方网址:http://ictclas.org/ 提供 详细介绍 和 各种 操作系统 环境下的 开发包(里面 含有 演示程序)。

     为了 方便 那些 对 程序设计 不感冒的 网友, 我在 这里 提供 Windows32位版本的 演示 程序 下载:

        http://en.cyberhorse-workshop.com/download/WordsDemo.rar

     下载后 解压缩 至 任意 文件夹, 不用安装, 使用时 直接运行 其中的 GOLAXY_DEMO.exe 程序 即可。 如果 需要 经常 使用, 可以 在 桌面上 放一个 快捷方式(对准 文件夹中的 GOLAXY_DEMO.exe 文件名 单击右键, 在 弹出的 快捷菜单 中 选 “发送到”——“桌面快捷方式”)。

     


    此贴已经被作者于 2012/10/4 14:17:07 编辑过

    回帖人: | 只看此人 | 不看此人 | 2012/10/4 12:05:53   
       第 5

    为了 方便 输入 空格, 本人 利用 谷歌输入法的 API 开发了 一款 空格断词 转换器。


     特点:

    1.空格前置。 即 每一次 选择(包括 在 候选区中的 任何一次 选择) 自动 在 所选 字、 

        词、 短语 前面 插入一个 空格。 所以有 2, 3 如下

    2.标点符号 前面 没有空格, 紧挨着 句尾;

    3.每一句的 句首 空 一格;

    4.1.1版“的” 和 “者” 前面 不会 自动 加 空格。

    5.用 联合键“Shift+Ctrl+C” 开/关 空格断词 功能。


    谷歌输入法扩展包——(全角)空格断词1.1版,下载(单击右键——另存为…):

    http://en.cyberhorse-workshop.com/download/wordspace.lua

     

    谷歌输入法扩展包——(半角)空格断词1.1版,下载(单击右键——另存为…):

    http://en.cyberhorse-workshop.com/download/wordspacebanjiao.lua

     

     谷歌输入法扩展包——(全角)空格断词1.1版,下载 压缩文件:
    http://en.cyberhorse-workshop.com/download/wordspace.rar

    谷歌输入法扩展包——(半角)空格断词1.1版,下载 压缩文件:
    http://en.cyberhorse-workshop.com/download/wordspacebanjiao.rar

     

    ★安装方法:
     ●安装 谷歌输入法(http://www.google.com/intl/zh-CN/ime/pinyin/);

     ●安装 空格断词扩展包:打开谷歌拼音输入法选项设置窗口,在"扩展"标签中,点击"安装扩展包"按钮,选择保存在计算机内的WordSpace.lua(也可以从Windows资源管理器,右键单击WordSpace.lua文件,选择“安装到谷歌拼音输入法”)。

     


    回帖人: | 只看此人 | 不看此人 | 2012/10/4 12:10:49    引用回复:
    6
    转至第2楼第 2 楼 wata 2012/10/4 11:58:39  的原帖:赞同!
     谢谢支持!
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 13:16:08    跟帖回复:
    7
    楼主,读了你用空格符分隔出来的文章,感觉象是结巴。
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 13:20:10    3g
    8
    觉得没那个必要
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 13:24:31    引用回复:
    9
    转至第7楼第 7 楼 freefayi 2012/10/4 13:16:08  的原帖:楼主,读了你用空格符分隔出来的文章,感觉象是结巴。这 还有个 习惯问题, 习惯了 就好, 呵呵。 至少 无需 费力 断词了。
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 13:25:14    引用回复:
    10
    转至第8楼第 8 楼 猫爪挠狗 2012/10/4 13:20:10  的原帖:觉得没那个必要 说一说 没有必要的 道理。
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 14:24:29    跟帖回复:
    11
    我也有同感 呵呵
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 14:24:37    引用回复:
    12
    转至第4楼第 4 楼 cyberhorse 2012/10/4 12:05:20  的原帖:

     这是 RUSHRUSHZOO 推荐 一款 将 文本 分词的 软件。

    大家看看对一篇网络文章的分词效果,能提高阅读速度。”

    官方网址:http://ictclas.org/ 提供 详细介绍 和 各种 操作系统 环境下的 开发包(里面 含有 演示程序)。

     为了 方便 那些 对 程序设计 不感冒的 网友, 我在 这里 提供 Windows32位版本的 演示 程序 下载:

        http://en.cyberhorse-workshop.com/download/WordsDemo.rar

     下载后 解压缩 至 任意 文件夹, 不用安装, 使用时 直接运行 其中的 GOLAXY_DEMO.exe 程序 即可。 如果 需要 经常 使用, 可以 在 桌面上 放一个 快捷方式(对准 文件夹中的 GOLAXY_DEMO.exe 文件名 单击右键, 在 弹出的 快捷菜单 中 选 “发送到”——“桌面快捷方式”)。

     



    建议 转贴文章的 猫友们 可以使用 这个 工具 将 文章 分词, 当然 前提条件 是 你 支持 并 愿意 推动 这项 文字改革。
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 14:27:32    引用回复:
    13
    转至第11楼第 11 楼 不敢思考A 2012/10/4 14:24:29  的原帖:我也有同感 呵呵 这个 表达 模棱两可 啊, 呵呵。 究竟 同的 是 哪一方的 感觉?
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 14:31:40    跟帖回复:
    14
         断开读起来还是有点不习惯 但是断开的表达更清晰 还有个弊端就是实行起来费空间 费纸.
    回帖人: | 只看此人 | 不看此人 | 2012/10/4 14:41:53    引用回复:
    15
    转至第14楼第 14 楼 不敢思考A 2012/10/4 14:31:40  的原帖:     断开读起来还是有点不习惯 但是断开的表达更清晰 还有个弊端就是实行起来费空间 费纸. 谢谢!
     认为 “断开的表达更清晰”, 就 可以 算作 是 基本 认同 改革大方向的。 刚开始 肯定会 存在 种种不足, 相信 一定会 在 实践中 慢慢 克服 和 完善的。 习惯 也 慢慢 会 建立起来的。 费纸 不是 问题, 毕竟 电子化 文本 是 大趋势, 且 人的 精力 比 纸张 更 宝贵。
    73032 次点击,558 个回复  1 2 3 4 5 6 7 8 9 10 ... 38 下一页
    跳转论坛至:
    快速回复:[原创]论中文引入空格符断词的必要性
    本站声明:本站BBS互动社区的文章由网友自行帖上,文责自负,对于网友的贴文本站均未主动予以提供、组织或修改;本站对网友所发布未经确证的商业宣传信息、广告信息、要约、要约邀请、承诺以及其他文字表述的真实性、准确性、合法性等不作任何担保和确认。因此本站对于网友发布的信息内容不承担任何责任,网友间的任何交易行为与本站无涉。任何网络媒体或传统媒体如需刊用转帖转载,必须注明来源及其原创作者。特此声明!

    【管理员特别提醒】 发布信息时请注意首先阅读 ( 琼B2-20060022 ):
    1.全国人大常委会关于维护互联网安全的决定2.凯迪网络BBS互动区用户注册及管理条例。谢谢!
    • 广告