第三届学生计算语言学研讨会论文集
The Third Student Workshop on Computational Linguistics (SWCL 2006)

前言与目录

I 词法、句法与语义分析

SWCL-06-001: 基于机器学习的分词不一致自动识别研究
卢俊之

SWCL-06-002: 蒙古文编码转换软件的设计与实现
图格木勒

SWCL-06-003: 面向大型叙事作品的指人成分识别
钱小飞,陈小荷,董宇,何晓丽

SWCL-06-004: 面向中文陌生文本的人机交互式分词方法
李斌,陈小荷

SWCL-06-005: 在篇章中面向产品类的命名实体识别研究
李治国,周俏丽

SWCL-06-006: 针对SVM中文分词特性的个性化后处理设计
王屹林,朱慕华,朱靖波

SWCL-06-007: 词汇化概率句法分析与动词子语类框架获取的互动方法
冀铁亮,穗志方

SWCL-06-008: 基于改进编辑距离和依存结构的句子相似度计算
刘宝艳,林鸿飞,杨志豪

SWCL-06-009: 面向句法分析的样本选择
孙俊,曹海龙,赵铁军

SWCL-06-010: 粤拼序列自动切分算法的研究
肖镜辉,刘秉权

SWCL-06-011: 语音识别后文本纠错处理
龚媛,李蕾

SWCL-06-012: LTP:语言技术平台
郎君,刘挺,张会鹏,李生

SWCL-06-013: 语料库语义成分标注的若干问题
许小星,亢世勇,孙茂松,刘金凤

SWCL-06-014: 中文语义角色标注的特征工程
刘怀军,车万翔,刘挺

SWCL-06-015: 中文褒贬义词语倾向性的分析
王根,赵军

SWCL-06-016: 基于知网的中文问题自动分类
孙景广,蔡东风,吕德新,董燕举

SWCL-06-017: 基于语义理解的文本倾向性识别机制
徐琳宏,林鸿飞,杨志豪

SWCL-06-018: 维吾尔语的词性标注校对初探
牛洪梅,吐尔根·依布拉音

SWCL-06-019: 中国哈萨克阿拉伯文与哈萨克斯拉夫文文本转换
伊力亚尔·加尔木哈买提,古丽拉·阿东别克

II 知识表示与机器学习

SWCL-06-020: 基于标注语料库的组合歧义检测与消解
孙承杰,黄昌宁,关毅

SWCL-06-021: 基于规则方法的汉语到语义网络语言的转换研究
张旭洁,夏幼明,刘冠晓,宋亚林

SWCL-06-022: 一种基于HNC理论的领域知识表示研究
缪建明,吴晨,郝慧宁,张全

SWCL-06-023: 生物文献的本体建模及其在语义查询中的应用
李姣,朱小燕

SWCL-06-024: 词汇语义相似度计算中相关技术的分析
余超,蔡东风,张桂平

SWCL-06-025: 条件随机域模型和实验分析
欧阳佑,李素建

SWCL-06-026: 中文单词聚类的比较研究
王波,王厚峰

SWCL-06-027: 现代汉语动态助词“了”的自动生成研究
何晓丽,陈小荷,陈锋,钱小飞

SWCL-06-028: 汉语空间关系中射体识别问题的研究与分析
赵纪元,李晗静,赵铁军

SWCL-06-029: 基于特征选择和语义扩展的词序列核函数研究
刘克彬,李芳,刘磊,韩颖

SWCL-06-030: 基于结构描述的汉字字形相似度计算
林民,宋柔

SWCL-06-031: 中国人名性别自动识别
郎君,秦兵,刘挺,李生

SWCL-06-032: 媒体用语中的语误分析
张金竹

SWCL-06-033: 基于抽样的两阶段支持向量机训练算法
曹菲菲,朱慕华,朱靖波

SWCL-06-034: 基于传媒语音语料库的不同语言样式统计分析
邹煜,侯敏,陈玉东,付莉

SWCL-06-035: Dotplotting文本分割技术的分析与改进
罗海涛,叶娜,朱靖波

SWCL-06-036: 关键词密度分布法在偏重摘要中的应用研究
闫英杰,林鸿飞,杨志豪

III 信息检索、抽取与过滤

SWCL-06-037: 基于主题词对的文档重排方法
何婷婷,许婷,瞿国忠,涂新辉

SWCL-06-038: 基于大规模日志分析的网络搜索引擎用户行为研究
余慧佳,刘奕群,张敏,茹立云,马少平

SWCL-06-039: 自然语言语义理解下的信息检索模型
吴晨,张全,缪建明,韦向峰

SWCL-06-040: 一种利用链接分析的Web话题跟踪方法
宋丹,林鸿飞,杨志豪

SWCL-06-041: 基于网页框架和规则的网页噪音去除方法
时达明,林鸿飞,杨志豪

SWCL-06-042: Web信息检索中相关词提示技术与评测
徐小琴,章成志

SWCL-06-043: 术语自动提取中的领域度计算方法研究
张秦龙,穗志方,丁万松

SWCL-06-044: 规则与统计相结合的案件名称识别
乔春庚,肖诗斌,孙丽华,施水才

SWCL-06-045: 中文事件抽取中事件类别的自动识别
赵妍研,王啸吟,秦兵,车万翔,刘挺

SWCL-06-046: 基于数据挖掘思想的网页正文抽取方法的研究
蒲宇达,关毅,王强

SWCL-06-047: 基于用户聚类的电子商务推荐系统
潘宇,林鸿飞,杨志豪

SWCL-06-048: 汉语base NP识别:错误驱动的组合分类器方法
徐昉,宗成庆

IV 语料库语言学

SWCL-06-049: 基于生语料、最大匹配切分语料以及熟语料的中文词频估计方法
乔维,孙茂松

SWCL-06-050: 小学生语言偏误分析
袁义春

SWCL-06-051: 语文词典标注词性的基本原则
樊立三,亢世勇,王兴隆,马永腾

SWCL-06-052: 语料库中的插入语标注研究
安娜,侯敏

SWCL-06-053: 基于标注语料库的《新闻联播》语言特征统计分析
王彬,王依然,文采菊,周鑫

SWCL-06-054: 基于多语境的相关词自动提取
章成志,苏兰芳

SWCL-06-055: 基于语料统计的以“不”开头双字分词不一致研究
程月,季娜,洪鹿平

SWCL-06-056: 基于受限最大熵模型的汉语词性标注的研究
袁彩霞,王小捷

SWCL-06-057: 带标注语料库中切分变异的统计分析及思考
董宇,陈小荷

SWCL-06-058: 中文缩略语知识库建设
支流,段慧明,朱学锋,俞士汶

SWCL-06-059: 《英汉蒙电子词典》的设计与实现
吴红英,嘎日迪,赵小兵,韩东妹

SWCL-06-060: 《蒙古语语法信息词典字符分库》的建立及意义
艳花

SWCL-06-061: 基于语料库的数量名短语识别
方芳,李斌

V 文本自动分类

SWCL-06-062: Impact of the Size of training Set on Text Categorization
Li Jingyang,Sun Maosong

SWCL-06-063: 关于文本分类中特征降维方式的研究
伍建军,康耀红

SWCL-06-064: 基于背景知识的文本自动分类
卢朋,曾隽芳,杨一平

SWCL-06-065: 中文网页形式自动分类
董静,林鸿飞,杨志豪

SWCL-06-066: 一种基于主题的文本聚类方法
赵世奇,刘挺,李生

SWCL-06-067: 面向对外汉语报刊教学的文本难易度分类
邹红建,杨尔弘

VI 机器翻译

SWCL-06-068: 日中机器翻译中汉语副词的数据处理
张颖

SWCL-06-069: 基于非连续短语的统计翻译模型
张大鲲,张玮,董静

SWCL-06-070: 影响统计翻译系统性能的因素分析
柴春光,宗成庆

SWCL-06-071: 翻译规则优化中的分层优化方法
刘树杰,杨沐昀,赵铁军

SWCL-06-072: 统计机器翻译中短语切分的新方法
何中军,刘群,林守勋

VII 张贴论文

SWCL-06-073: 基于规则的复句中的关系词标注探讨
胡金柱,沈威,杜超华

SWCL-06-074: 基于复句语料库的分词系统的研究
杜超华,沈威,姚双云

SWCL-06-075: 文本篇章结构的自动标引
张美娜,亓超,迟呈英,战学刚

SWCL-06-076: 一种基于HTML位置信息的查询扩展技术
陈志玮,肖诗斌,施水才,王昕

SWCL-06-077: 基于标注语料库的情景语义成分分析
刘金凤

SWCL-06-078: 外国人汉语虚词辅助学习系统研究
何晓丽,陈小荷,洪鹿平,卢俊之

SWCL-06-079: 基于标注语料库以[S][P][O]为样本的句系研究
孙道功

SWCL-06-080: 基于渡越矩阵的复句关系词自动标注初探
胡金柱,沈威,杜超华,罗进军

SWCL-06-081: 中国EFL学习者自动作文评分探索
葛诗利,陈潇潇

SWCL-06-082: 汉语依存树库的构建
赵怿怡,关润池

SWCL-06-083: 基于语义统计的中文自动文摘研究
吕静,昝红英

SWCL-06-084: 基于条件随机域的中文命名实体识别
史树敏,王志强,周浪,冯冲,黄河燕

SWCL-06-085: “不是”的用法及自动处理研究
张运良

SWCL-06-086: 现代汉语“名+名+名”组合的统计分析
王东波,陈锋

SWCL-06-087: 短语结构树到依存树的转换
王跃龙,韩希

SWCL-06-088: 基于问句相似度的中文FAQ问答系统研究
叶正,林鸿飞,杨志豪

SWCL-06-089: 基于PageRank和锚文本的网页排序研究
刘菁菁,林鸿飞,杨志豪

SWCL-06-090: 基于条件随机域的生物医学命名实体识别
李彦鹏,杨志豪,林鸿飞

SWCL-06-091: 新编同义词词林语义分类体系
马永腾,亢世勇

SWCL-06-092: 全切分图与路径表达式在分词算法中的应用
陈晓苏,邹园斌,张文珂

SWCL-06-093: 构建“尹湛纳希辞典”的设想
张建梅,赵玉荣,包晓荣,高娃 哈斯图雅