python读取.ttf字体文件

时间:2024-11-19 20:44:28

最近做OCR的时候,为了方便,使用代码生成所需要的数据,因此,需要使用多种字体文件,记录下遇到的一些问题:
使用的模型:AttentionOCR
使用的生成器:TextRecognitionDataGenerator

使用python读取.ttf字体文件

# 使用fontTools库
from fontTools.ttLib import TTFont

font = TTFont(font)
# 输出的uniMap是一个字典,key代表的unicode的int值,value代表unicode的名字
uniMap = font['cmap'].tables[0].ttFont.getBestCmap()

关于简繁字体的转换

/skydark/nstools/master/zhtools/
/skydark/nstools/master/zhtools/zh_wiki.py

# 先将上面两个文件放在同一目录下
from langconv import *


def simple2tradition(line):
    # 将简体转换成繁体
    line = Converter('zh-hant').convert(line)
    return line

def tradition2simple(line):
    # 将繁体转换成简体
    line = Converter('zh-hans').convert(line)
    return line

lines = []
with open('../c2s/', 'r') as f:
    for line in f:
        new_line = tradition2simple(line.strip())
        with open('../', 'a') as fw:
            fw.write('{}\n'.format(new_line))

判断字符是否在字体里

# True:在
ord('1') in uniMap.keys()

将RGB颜色转为十六进制表示

def RGB_to_Hex(rgb):
	# 传入的rgb应为字符串
    RGB = rgb.split(',') 
    color = '#'
    for i in RGB:
        num = int(i)
        # 将R、G、B分别转化为16进制拼接转换并大写  hex() 函数用于将10进制整数转换成16进制,以字符串形式表示
        color += hex(num)[-2:].replace('x', '0').upper()
    return color