• Stars
    star
    257
  • Rank 158,022 (Top 4 %)
  • Language
    C#
  • License
    MIT License
  • Created over 4 years ago
  • Updated 5 months ago

Reviews

There are no reviews yet. Be the first to send feedback to the community and the maintainers!

Repository Details

中文解析通用工具。包括拼音,简繁转换,数字读法,货币读法。

Chinese

中文解析通用工具。包括拼音,简繁转换,数字读法,货币读法。


安装

通过 Nuget 使用 .NET CLI 安装:

dotnet add package Chinese

词库安装:

dotnet add package Chinese.Words

版本更新

版本计划:0.7.0

  • 单独提供专用于 处理中文数值 的库:Chinese.Numerics
  • 优化缓存逻辑:现在不会在初始化时载入所有字词,以减小启动压力(初始内存使用减少约 90%)。
  • 提供外部词库支持,现可使用 数据库 作为外部词库源。
  • 提供一个外部词库(提供 sqlite 格式介质,收录约 7w 词,可自行转换为其他数据库格式)。
  • 大量逻辑优化。
  • 收集建议:希望能够通过某种方式接受用户提交词库修正。

版本:0.5.0

  • 简繁转换性能优化(NETStandard2.0+NET5.0+,通常情况耗时减少约 90%)。

  • 计量读法性能优化(耗时减少约 85%)。

  • 修复计量读法尾零转换错误问题:

    var wrong = ChineseCurrency.GetString(10_0000);  // 错误:一十万零元整
    var right = ChineseCurrency.GetString(10_0000);  // 正确:一十万元整

版本:4.5.0

  • 更新部分字默认拼音。
  • 发布测试词库 Chinese.Words(v0.0.1)。

版本:4.1.0

  • 按词频为单字提供默认拼音。

拼音

// "mian3 fei4,kua4 ping2 tai2,kai1 yuan2!"
Pinyin.GetString("免费,跨平台,开源!", PinyinFormat.Default);
// "mian fei,kua ping tai,kai yuan!"
Pinyin.GetString("免费,跨平台,开源!", PinyinFormat.WithoutTone);
// "miǎn fèi,kuà píng tái,kāi yuán!"
Pinyin.GetString("免费,跨平台,开源!", PinyinFormat.Phonetic);
// "mf,kpt,ky!"
Pinyin.GetString("免费,跨平台,开源!", PinyinFormat.InitialConsonant);

使用词库 Chinese.Words 示例 :

var lexicon = new ChineseLexicon(Additional.CommonWords, Builtin.ChineseChars);
using (lexicon.BeginScope())
{
    var str = Pinyin.GetString("只有这只鸟跑得很快。");	
    // zhi3 you3 zhe4 zhi1 niao3 pao3 de2 hen3 kuai4。
    var words = ChineseTokenizer.SplitWords("只有这只鸟跑得很快。");
    // 只有 / 这只 / 鸟 / 跑 / 得 / 很快 / 。
}

简繁转换

ChineseConverter.ToTraditional("免费,跨平台,开源!");    // "免費,跨平臺,開源!"
ChineseConverter.ToSimplified("免費,跨平臺,開源!");     // "免费,跨平台,开源!"

数字读法

计量读法

小写读法:

var options = new ChineseNumberOptions { Simplified = false, Upper = false };
ChineseNumber.GetString(10_0001, options);    // "一十万零一"
ChineseNumber.GetString(10_0101, options);    // "一十万零一百零一"
ChineseNumber.GetString(10_1001, options);    // "一十万一千零一"
ChineseNumber.GetString(10_1010, options);    // "一十万一千零一十"
var options = new ChineseNumberOptions { Simplified = true, Upper = false };
ChineseNumber.GetString(10_0001, options);    // "十万零一"
ChineseNumber.GetString(10_0101, options);    // "十万零一百零一"
ChineseNumber.GetString(10_1001, options);    // "十万一千零一"
ChineseNumber.GetString(10_1010, options);    // "十万一千零一十"

大写读法:

var options = new ChineseNumberOptions { Simplified = false, Upper = true };
ChineseNumber.GetString(10_0001, options);    // "壹拾万零壹"
ChineseNumber.GetString(10_0101, options);    // "壹拾万零壹佰零壹"
ChineseNumber.GetString(10_1001, options);    // "壹拾万壹仟零壹"
ChineseNumber.GetString(10_1010, options);    // "壹拾万壹仟零壹拾"
var options = new ChineseNumberOptions { Simplified = true, Upper = true };
ChineseNumber.GetString(10_0001, options);    // "拾万零壹"
ChineseNumber.GetString(10_0101, options);    // "拾万零壹佰零壹"
ChineseNumber.GetString(10_1001, options);    // "拾万壹仟零壹"
ChineseNumber.GetString(10_1010, options);    // "拾万壹仟零壹拾"

大数读法(万、亿、兆、京、垓、秭、穰):

// "一穰二千三百四十五秭六千七百八十九垓零一百二十三京四千五百六十七兆八千九百零一亿二千三百四十五万六千七百八十九"
ChineseNumber.GetString(1_2345_6789_0123_4567_8901_2345_6789m);
// "壹穰贰仟叁佰肆拾伍秭陆仟柒佰捌拾玖垓零壹佰贰拾叁京肆仟伍佰陆拾柒兆捌仟玖佰零壹亿贰仟叁佰肆拾伍万陆仟柒佰捌拾玖"
ChineseNumber.GetString(1_2345_6789_0123_4567_8901_2345_6789m, x => x.Upper = true);

中文读法转数值:

ChineseNumber.GetNumber("一十万零一");          // 10_0001
ChineseNumber.GetNumber("一十万零一百零一");    // 10_0101
ChineseNumber.GetNumber("一十万一千零一");      // 10_1001
ChineseNumber.GetNumber("一十万一千零一十");    // 10_1010
// 1_2345_6789_0123_4567_8901_2345_6789
ChineseNumber.GetNumber("一穰二千三百四十五秭六千七百八十九垓零一百二十三京四千五百六十七兆八千九百零一亿二千三百四十五万六千七百八十九");

自定义分级单位:

ChineseNumber.SuperiorLevels = new[] { "", "", "亿", "万亿", "亿亿", "万亿亿", "亿亿亿", "万亿亿亿" };            
ChineseNumber.GetString(30_0020_0000_0001);    // 三十万亿零二十亿零一

编号读法

ChineseNumber.GetCodeString(10_0001.ToString(), upper: false);    // "一〇〇〇〇一"
ChineseNumber.GetCodeString(10_0101.ToString(), upper: false);    // "一〇〇一〇一"
ChineseNumber.GetCodeString(10_1001.ToString(), upper: false);    // "一〇一〇〇一"
ChineseNumber.GetCodeString(10_1010.ToString(), upper: false);    // "一〇一〇一〇"
ChineseNumber.GetCodeString(10_0001.ToString(), upper: true);     // "壹零零零零壹"
ChineseNumber.GetCodeString(10_0101.ToString(), upper: true);     // "壹零零壹零壹"
ChineseNumber.GetCodeString(10_1001.ToString(), upper: true);     // "壹零壹零零壹"
ChineseNumber.GetCodeString(10_1010.ToString(), upper: true);     // "壹零壹零壹零"

中文读法转数值编号:

ChineseNumber.GetCodeNumber("一〇〇〇〇一");    // "100001"
ChineseNumber.GetCodeNumber("一〇〇一〇一");    // "100101"
ChineseNumber.GetCodeNumber("一〇一〇〇一");    // "101001"
ChineseNumber.GetCodeNumber("一〇一〇一〇");    // "101010"

货币读法

货币小写读法:

var options = new ChineseNumberOptions { Simplified = false, Upper = false };
ChineseCurrency.GetString(10_0001, options);       // "一十万零一元整"
ChineseCurrency.GetString(10_0101, options);       // "一十万零一百零一元整"
ChineseCurrency.GetString(10_1001, options);       // "一十万一千零一元整"
ChineseCurrency.GetString(10_1010, options);       // "一十万一千零一十元整"
ChineseCurrency.GetString(10_0001.2m, options);    // "一十万零一元二角整"
ChineseCurrency.GetString(10_0001.23m, options);   // "一十万零一元二角三分"
ChineseCurrency.GetString(10_0001.03m, options);   // "一十万零一元零三分"
var options = new ChineseNumberOptions { Simplified = true, Upper = false };
ChineseCurrency.GetString(10_0001, options);       // "十万零一元整"
ChineseCurrency.GetString(10_0101, options);       // "十万零一百零一元整"
ChineseCurrency.GetString(10_1001, options);       // "十万一千零一元整"
ChineseCurrency.GetString(10_1010, options);       // "十万一千零一十元整"
ChineseCurrency.GetString(10_0001.2m, options);    // "十万零一元二角整"
ChineseCurrency.GetString(10_0001.23m, options);   // "十万零一元二角三分"
ChineseCurrency.GetString(10_0001.03m, options);   // "十万零一元零三分"

货币大写读法:

var options = new ChineseNumberOptions { Simplified = false, Upper = true };
ChineseCurrency.GetString(10_0001, options);       // "壹拾万零壹圆整"
ChineseCurrency.GetString(10_0101, options);       // "壹拾万零壹佰零壹圆整"
ChineseCurrency.GetString(10_1001, options);       // "壹拾万壹仟零壹圆整"
ChineseCurrency.GetString(10_1010, options);       // "壹拾万壹仟零壹拾圆整"
ChineseCurrency.GetString(10_0001.2m, options);    // "壹拾万零壹圆贰角整"
ChineseCurrency.GetString(10_0001.23m, options);   // "壹拾万零壹圆贰角叁分"
ChineseCurrency.GetString(10_0001.03m, options);   // "壹拾万零壹圆零叁分"
var options = new ChineseNumberOptions { Simplified = true, Upper = true };
ChineseCurrency.GetString(10_0001, options);       // "拾万零壹圆整"
ChineseCurrency.GetString(10_0101, options);       // "拾万零壹佰零壹圆整"
ChineseCurrency.GetString(10_1001, options);       // "拾万壹仟零壹圆整"
ChineseCurrency.GetString(10_1010, options);       // "拾万壹仟零壹拾圆整"
ChineseCurrency.GetString(10_0001.2m, options);    // "拾万零壹圆贰角整"
ChineseCurrency.GetString(10_0001.23m, options);   // "拾万零壹圆贰角叁分"
ChineseCurrency.GetString(10_0001.03m, options);   // "拾万零壹圆零叁分"

中文读法转货币数值:

ChineseCurrency.GetNumber("一十万零一元整");         // 10_0001
ChineseCurrency.GetNumber("一十万零一百零一元整");    // 10_0101
ChineseCurrency.GetNumber("一十万一千零一元整");      // 10_1001
ChineseCurrency.GetNumber("一十万一千零一十元整");    // 10_1010
ChineseCurrency.GetNumber("一十万零一元二角整");      // 10_0001.2m
ChineseCurrency.GetNumber("一十万零一元二角三分");    // 10_0001.23m
ChineseCurrency.GetNumber("一十万零一元零三分");      // 10_0001.03m