您现在的位置是:主页 > 虚拟服务器 >

香港带宽_天翼云APP_高性价比

2021-09-08 07:18虚拟服务器 人已围观

简介HANA上根据不同的TAU规则有两种字典定制方式—LXP和实体抽取。 LXP指LINGANALYSIS\u BASIC、LingAnyAnalysis\u STEMS、LINGANALYSIS\u FULL,实体抽取指其他。 关于如何定制字典进行实体抽取,您可以参...

HANA上根据不同的TAU规则有两种字典定制方式—LXP和实体抽取。

LXP指LINGANALYSIS\u BASIC、LingAnyAnalysis\u STEMS、LINGANALYSIS\u FULL,淘客商城,实体抽取指其他。

关于如何定制字典进行实体抽取,您可以参考SAP HANA在中国新年里的博客问候语-定制文本分析提取

这里我们为HANA SP09上的简体中文简体体语言LXP定制字典。例如,如果您的表内容包含单词"杀锏",并且您创建了"杀"全文索引,什么是云,您将发现该单词被分为"杀锏"和"锏"。因此,我们的目的是让HANA识别新单词"杀锏"。

创建一个xs项目和新文件夹"config",物联网架构,并创建一个分析_FULL.hdbtextconfig文件此文件夹中的文件

关于.hdbtextconfig文件的内容,请参阅指南中的第3.3章文本分析配置文件语法\u hana\u Text\u Analysis\u Developer\u Guide\u en.pdf

以下内容是您需要在此文件中配置的地方:

true

!–确定梗味是标准的还是扩展的?(默认为'std')–>

expanded

完成内容后,激活此.hdbtextconfig文件。

在HANA服务器机器上的\usr\sap\XXX\SYS\global\hdb\custom\config\lexicon\lang\下找到自定义词典,filename与上面.hdbtextconfig文件中VariantString的值相关。也就是说,买云服务器,如果VariantString=expanded,则文件名为简体中文-扩展的.sample-cd;否则,如果值为std,则文件名为简体中文-标准样品-光盘。这两个文件除了文件名外是相同的。

记住在完成自定义词典后,您必须重新激活.hdbtextconfig文件才能使该词典生效。

这里我的.hdbtextconfig的路径是ta_dict.config文件在存储库中。所以在create fulltext index的SQL中,配置是'ta'_dict.config文件●LINGANALYSIS\u FULL.

创建列表"SEGMENTATION\u TEST"(

"URL"VARCHAR(200),

"CONTENT"NCLOB,

"LANGU"VARCHAR(10),

主键("URL")

);

创建全文索引ta.FT\ U索引

开启ta.U试验(内容)文本分析

配置"ta"_dict.config文件●LINGANALYSIS\u FULL'

语言栏"LANGU";

插入ta。"SEGMENTATION\u TEST"(网址、内容、语言)

值('三十、 XXX.XXX'、'杀锏'、'zh');

然后检查索引表的内容,就可以了找到‘杀锏’。

另外,店铺淘客怎么做,只有日语、简体中文、传统中文和泰语有相应的示例cd文件,所以我猜其他语言不支持这种字典定制。我试着学英语,但没用。但我不学其他语言。

有什么建议,请留言。

Tags: 香港  带宽  天翼  性价比 

站点信息

  • 文章统计93465篇文章