API文档¶

Grocery¶

class tgrocery.Grocery(name, custom_tokenize=None)

def Grocery.train(train_src, delimiter='\t')

获取训练样本，生成分类模型

train_src可以是嵌套列表或文件路径
- 嵌套列表：实体是两个字符串构成的tuple，第一个字符串是类别标签，第二个字符串是语料文本
- 文件路径：一行为一个训练样本，类别标签在前、语料文本在后，默认分隔符是\t
delimiter是解析训练样本时所用的分隔符，仅在train_src为文件路径时生效

def Grocery.get_load_status()

返回目前模型是否在已训练或已加载的状态

def Grocery.predict(single_text)

def Grocery.save()

保存模型到本地

def Grocery.load()

从本地加载模型

def Grocery.test(test_src, delimiter='\t')

测试模型在测试样本中取得的准确率

test_src可以是嵌套列表或文件路径
- 嵌套列表：实体是两个字符串构成的tuple，第一个字符串是类别标签，第二个字符串是语料文本
- 文件路径：一行为一个测试样本，类别标签在前、语料文本在后，默认分隔符是\\t
delimiter是解析测试样本时所用的分隔符，仅在test_src为文件路径时生效
返回一个GroceryTestResult对象

对新语料预测后的结果

GroceryPredictResult.predicted_y

预测的类别标签

GroceryPredictResult.dec_values

对测试样本测试后的结果

GroceryTestResult.accuracy_overall

不分类别的总体准确率，浮点数，0到1之间

GroceryTestResult.accuracy_labels

GroceryTestResult.recall_labels

def GroceryTestResult.show_result()