@inproceedings{Danzhengji-etal-2023-zang
    author = {旦正吉  and  华却才让  and  完么措  and  白, 颖},
    author = {Danzhengji  and  Huaquecairang  and  Wanmechuo  and  Ying, Bai},
    title = {藏语句子语义组块标注数据集的构建方法研究(A Study on the Construction of a Tibetan Sentence Semantic Block Annotation Dataset)},
    booktitle = {"Findings of the Proceedings of the 22nd China National Conference on Computational Linguistics"},
    month = {"August"},
    year = {"2023"},
    address = {"Harbin, China"},
    publisher = {"Chinese Information Processing Society of China"},
    url = {https://aclanthology.org/2023.findings-ccl-1.7},
    pages = {68--78},
    abstract = {"语义组块对自然语言的语义理解和分析有着重要的作用，其自动标注技术依赖于良好的语义组块标注训练数据集。目前，藏语方面未发现语义组块研究方面的分类体系，考虑到按粗粒度分析语义不利于语义解析和知识抽取等任务，选择了细粒度语义分析方法，依据不同藏文句型中语义组块的结构特征，制定了藏语句子语义组块标注规范 (TSSCTS-13)。在此基础上，构建了一个实用的藏语句子语义组块标注资源库(TSSCTL-44302)。截至目前，共完成了 498619 个语义组块标注，并在该文提出的藏文音节向量和 BILSTM-CRF 相结合模型上完成了自动识别的实验。综合测试实验结果F1 值为 95.28%，精确率为 94.95%，召回率为 95.62%，结果表明该文构建的数据集可以应用于藏语语义领域的语义组块识别任务。"},
    language = "Chinese",
}