文件名称:Transliteration-App:Gradio应用程序,用于将文本从罗马脚本转译为印地语,泰卢固语,泰米尔语,卡纳达语的本机脚本
文件大小:11.1MB
文件格式:ZIP
更新时间:2024-04-08 06:16:49
Python
音译应用 应用程序用于将文本从罗Maven字音译为印地语,泰卢固语,泰米尔语,卡纳达语的本机脚本 什么是音译? 音译是将文本从一个脚本转换为另一个脚本。 使用此应用程序,可以将罗马脚本中的单词音译为这些语言的本地脚本。 查看下面的演示 在职的 音译模型基本上是基于Luong风格注意的编解码网络。 脚步 句子被分解成连续的字符序列 每个字符序列进一步细分为字母和非字母序列 当字母序列被音译时,非字母序列保持不变。 当将罗马化的单词(即字母序列)输入模型时,它将逐步执行解码 在每个时间步长上对输出执行波束搜索(波束大小为5) ,最后选择具有最高对数概率得分的单词。 一旦获得了波束搜索的结果,就以保留标点符号的方式重新组合音译词,并返回最后一个句子。 数据集: 如有疑问,请联系 演示版
【文件预览】:
Transliteration-App-main
----.gitignore(6KB)
----requirements.txt(3KB)
----data()
--------tamil()
--------hindi()
--------kannada()
--------telugu()
----LICENSE(34KB)
----launch.py(797B)
----scripts()
--------encoders.py(14KB)
--------decoders.py(49KB)
--------train_utils.py(2KB)
--------layers.py(4KB)
--------transliteration_tokenizers.py(2KB)
--------app_utils.py(3KB)
--------beam_search.py(21KB)
--------model_loading_utils.py(2KB)
--------model.py(9KB)
----README.md(1KB)
----demo.gif(3.04MB)