开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录

前言以前在 github 上自己开源了一些项目 。碍于技术与精力,大部分项目都是 java 实现的 。
【开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录】这对于非 java 开发者而言很不友好,对于不会编程的用户更加不友好 。
为了让更多的人可以使用到这些简单的小工具,周末抽时间将几个开源项目添加了 web 服务实现 。
开源项目中文繁简体转换简介:支持中文繁简体的在线转换 。
在线地址:https://houbb.github.io/opensource/opencc4j/
开源地址:https://github.com/houbb/opencc4j
用法简介此处仅选择一个作为例子介绍 , 其他用法大同小异 。

开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录

文章插图
【处理】将左边的内容,按照下拉框的选择,结果会自动填充在右边 。
【互换】互换左右两边的内容 。平时测试繁体=》简体 , 和简体=》繁体更加方便 。
【复制】复制右边的内容到粘贴板 。
敏感词简介:基于 DFA 算法实现的高性能 java 敏感词工具框架 。请勿发布涉及政治、广告、营销、FQ、违反国家法律法规等内容 。
在线地址:https://houbb.github.io/opensource/sensitive-word/
开源地址:https://github.com/houbb/sensitive-word
拼音简介:高性能中文转拼音工具 。支持同音字 。
在线地址:https://houbb.github.io/opensource/pinyin/
开源地址:https://github.com/houbb/pinyin
可以很方便的把一段文字转换为对应的拼音,比如前言的内容默认如下:
yǐ qián zài github shàng zì jǐ kāi yuán le yī xiē xiàng mù。ài yú jì shù yǔ jīng lì,dà bù fèn xiàng mù dōu shì java shí xiàn de。zhè duì yú fēi java kāi fā zhě ér yán hěn bù yǒu hǎo,duì yú bú huì biān chéng de yòng hù gèng jiā bù yǒu hǎo。wèi le ràng gèng duō de rén kě yǐ shǐ yòng dào zhè xiē jiǎn dān de xiǎo gōng jù,zhōu mò chōu shí jiān jiāng jǐ gè kāi yuán xiàng mù tiān jiā le web fú wù shí xiàn。分词简介:基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现 。
在线地址:https://houbb.github.io/opensource/segment/
开源地址:https://github.com/houbb/segment
分词,可以说是 NLP 的基石 。
前言的内容分词效果如下:
[以前[0,2), 在[2,3),[3,4), github[4,10),[10,11), 上自[11,13), 己[13,14), 开源[14,16), 了[16,17), 一些[17,19), 项目[19,21),。[21,22), 碍于[22,24), 技术[24,26), 与[26,27), 精力[27,29), ,[29,30), 大部分[30,33), 项目[33,35), 都[35,36), 是[36,37),[37,38), java[38,42),[42,43), 实现[43,45), 的[45,46),。[46,47), [47,48), [48,49), 这[49,50), 对于[50,52), 非[52,53),[53,54), java[54,58),[58,59), 开发者[59,62), 而言[62,64), 很[64,65), 不[65,66), 友好[66,68),,[68,69), 对于[69,71), 不会[71,73), 编程[73,75), 的[75,76), 用户[76,78), 更加[78,80), 不[80,81), 友好[81,83),。[83,84), [84,85), [85,86), 为了[86,88), 让[88,89), 更多[89,91), 的[91,92), 人[92,93), 可以[93,95), 使用[95,97), 到[97,98), 这些[98,100), 简单[100,102), 的[102,103), 小工[103,105), 具[105,106), ,[106,107), 周末[107,109), 抽时间[109,112), 将[112,113), 几个[113,115), 开源[115,117), 项目[117,119), 添加[119,121), 了[121,122),[122,123), web[123,126),[126,127), 服务[127,129), 实现[129,131),。[131,132)]汉字相似度简介:汉字相似度计算工具 。中文形近字算法
在线地址:https://houbb.github.io/opensource/nlp-hanzi-similar/
开源地址:https://github.com/houbb/nlp-hanzi-similar
markdown 目录简介:为 markdown 文件生成 toc 目录
在线地址:https://houbb.github.io/opensource/markdown-toc/
开源地址:https://github.com/houbb/markdown-toc
个人平时的博客都是使用 markdown 编写的,专注于写作 。markdown-toc 可以为这样的文本生成对应的 toc 。
比如本篇文章 , 直接放在 github 上,是支持跳转的 。
* [前言](#前言)* [开源项目](#开源项目)* [中文繁简体转换](#中文繁简体转换)* [用法简介](#用法简介)* [敏感词](#敏感词)* [拼音](#拼音)* [分词](#分词)* [汉字相似度](#汉字相似度)* [markdown 目录](#markdown-目录)
开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录

文章插图
小结这样的小工具,实现起来非常简单 。
但是对于用户而言,意义还是比较大的 。
最近在学习一些 AI 相关的东西,自己平时不搞 python,很多开源项目,没有 web 体验版本看起来就会很吃力 。
不同的语言产生了难以逾越的鸿沟,愿你我能够借助 WEB 的力量,跨过去 。

推荐阅读