Java CharacterUtils类代码示例

OGeek|极客世界-中国程序员成长平台 › 门户 › 编程› Java›Java编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

本文整理汇总了Java中org.apache.lucene.analysis.util.CharacterUtils类的典型用法代码示例。如果您正苦于以下问题：Java CharacterUtils类的具体用法？Java CharacterUtils怎么用？Java CharacterUtils使用的例子？那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。

CharacterUtils类属于org.apache.lucene.analysis.util包，在下文中一共展示了CharacterUtils类的16个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于我们的系统推荐出更棒的Java代码示例。

示例1: Lucene43EdgeNGramTokenFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Creates EdgeNGramTokenFilter that can generate n-grams in the sizes of the given range
 *
 * @param input {@link org.apache.lucene.analysis.TokenStream} holding the input to be tokenized
 * @param minGram the smallest n-gram to generate
 * @param maxGram the largest n-gram to generate
 */
public Lucene43EdgeNGramTokenFilter(TokenStream input, int minGram, int maxGram) {
  super(input);

  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }

  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }

  this.charUtils = CharacterUtils.getJava4Instance();
  this.minGram = minGram;
  this.maxGram = maxGram;
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:23，代码来源:Lucene43EdgeNGramTokenFilter.java

示例2: init

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
private void init(Version version, int minGram, int maxGram, boolean edgesOnly) {
  if (!version.onOrAfter(Version.LUCENE_4_4_0)) {
    throw new IllegalArgumentException("This class only works with Lucene 4.4+. To emulate the old (broken) behavior of NGramTokenizer, use Lucene43NGramTokenizer/Lucene43EdgeNGramTokenizer");
  }
  charUtils = version.onOrAfter(Version.LUCENE_4_4_0)
      ? CharacterUtils.getInstance(version)
      : CharacterUtils.getJava4Instance();
  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }
  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }
  this.minGram = minGram;
  this.maxGram = maxGram;
  this.edgesOnly = edgesOnly;
  charBuffer = CharacterUtils.newCharacterBuffer(2 * maxGram + 1024); // 2 * maxGram in case all code points require 2 chars and + 1024 for buffering to not keep polling the Reader
  buffer = new int[charBuffer.getBuffer().length];
  // Make the term att large enough
  termAtt.resizeBuffer(2 * maxGram);
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:22，代码来源:NGramTokenizer.java

示例3: MorfologikFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated Use {@link #MorfologikFilter(TokenStream,String)}
 */
@Deprecated
public MorfologikFilter(final TokenStream in, final String dict, final Version version) {
  super(in);
  this.input = in;

  // SOLR-4007: temporarily substitute context class loader to allow finding dictionary resources.
  Thread me = Thread.currentThread();
  ClassLoader cl = me.getContextClassLoader();
  try {
    me.setContextClassLoader(morfologik.stemming.Dictionary.class.getClassLoader());
    this.stemmer = new DictionaryLookup(morfologik.stemming.Dictionary.getForLanguage(dict));
    this.charUtils = CharacterUtils.getInstance(version);
    this.lemmaList = Collections.emptyList();
  } finally {
    me.setContextClassLoader(cl);
  }  
}

开发者ID:europeana，项目名称:search，代码行数:21，代码来源:MorfologikFilter.java

示例4: PinyinNGramTokenFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Creates EdgeNGramTokenFilter that can generate n-grams in the sizes of
 * the given range
 * 
 * @param input
 *            {@link TokenStream} holding the input to be tokenized
 * @param side
 *            the {@link Side} from which to chop off an n-gram
 * @param minGram
 *            the smallest n-gram to generate
 * @param maxGram
 *            the largest n-gram to generate
 */
public PinyinNGramTokenFilter(TokenStream input, int minGram, int maxGram) {
	super(input);

	if (minGram < 1) {
		throw new IllegalArgumentException("minGram must be greater than zero");
	}

	if (minGram > maxGram) {
		throw new IllegalArgumentException("minGram must not be greater than maxGram");
	}

	this.charUtils = CharacterUtils.getInstance();
	this.minGram = minGram;
	this.maxGram = maxGram;
}

开发者ID:liangbaolin，项目名称:pinyinAnalyzer，代码行数:29，代码来源:PinyinNGramTokenFilter.java

示例5: MorfologikFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Builds a filter for given PolishStemmer.DICTIONARY enum.
 * 
 * @param in   input token stream
 * @param dict PolishStemmer.DICTIONARY enum
 * @param version Lucene version compatibility for lowercasing.
 */
public MorfologikFilter(final TokenStream in, final DICTIONARY dict, final Version version) {
  super(in);
  this.input = in;
  
  // SOLR-4007: temporarily substitute context class loader to allow finding dictionary resources.
  Thread me = Thread.currentThread();
  ClassLoader cl = me.getContextClassLoader();
  try {
    me.setContextClassLoader(PolishStemmer.class.getClassLoader());
    this.stemmer = new PolishStemmer(dict);
    this.charUtils = CharacterUtils.getInstance(version);
    this.lemmaList = Collections.emptyList();
  } finally {
    me.setContextClassLoader(cl);
  }  
}

开发者ID:pkarmstr，项目名称:NYBC，代码行数:24，代码来源:MorfologikFilter.java

示例6: init

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
private void init(Version version, int minGram, int maxGram, boolean edgesOnly) {
  if (!version.onOrAfter(Version.LUCENE_44)) {
    throw new IllegalArgumentException("This class only works with Lucene 4.4+. To emulate the old (broken) behavior of NGramTokenizer, use Lucene43NGramTokenizer/Lucene43EdgeNGramTokenizer");
  }
  charUtils = version.onOrAfter(Version.LUCENE_44)
      ? CharacterUtils.getInstance(version)
      : CharacterUtils.getJava4Instance();
  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }
  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }
  this.minGram = minGram;
  this.maxGram = maxGram;
  this.edgesOnly = edgesOnly;
  charBuffer = CharacterUtils.newCharacterBuffer(2 * maxGram + 1024); // 2 * maxGram in case all code points require 2 chars and + 1024 for buffering to not keep polling the Reader
  buffer = new int[charBuffer.getBuffer().length];
  // Make the term att large enough
  termAtt.resizeBuffer(2 * maxGram);
}

开发者ID:yintaoxue，项目名称:read-open-source-code，代码行数:22，代码来源:NGramTokenizer.java

示例7: MorfologikFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Creates MorfologikFilter
 * @param in   input token stream
 * @param version Lucene version compatibility for lowercasing.
 */
public MorfologikFilter(final TokenStream in, final Version version) {
  super(in);
  this.input = in;
  
  // SOLR-4007: temporarily substitute context class loader to allow finding dictionary resources.
  Thread me = Thread.currentThread();
  ClassLoader cl = me.getContextClassLoader();
  try {
    me.setContextClassLoader(PolishStemmer.class.getClassLoader());
    this.stemmer = new PolishStemmer();
    this.charUtils = CharacterUtils.getInstance(version);
    this.lemmaList = Collections.emptyList();
  } finally {
    me.setContextClassLoader(cl);
  }  
}

开发者ID:yintaoxue，项目名称:read-open-source-code，代码行数:22，代码来源:MorfologikFilter.java

示例8: Lucene43NGramTokenFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Creates Lucene43NGramTokenFilter with given min and max n-grams.
 * @param input {@link org.apache.lucene.analysis.TokenStream} holding the input to be tokenized
 * @param minGram the smallest n-gram to generate
 * @param maxGram the largest n-gram to generate
 */
public Lucene43NGramTokenFilter(TokenStream input, int minGram, int maxGram) {
  super(new CodepointCountFilter(input, minGram, Integer.MAX_VALUE));
  this.charUtils = CharacterUtils.getJava4Instance();
  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }
  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }
  this.minGram = minGram;
  this.maxGram = maxGram;

  posIncAtt = new PositionIncrementAttribute() {
    @Override
    public void setPositionIncrement(int positionIncrement) {}
    @Override
    public int getPositionIncrement() {
        return 0;
      }
  };
  posLenAtt = new PositionLengthAttribute() {
    @Override
    public void setPositionLength(int positionLength) {}
    @Override
    public int getPositionLength() {
        return 0;
      }
  };
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:36，代码来源:Lucene43NGramTokenFilter.java

示例9: EdgeNGramTokenFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated For {@link Version#LUCENE_4_3_0} or below, use {@link Lucene43EdgeNGramTokenFilter}, otherwise use {@link #EdgeNGramTokenFilter(TokenStream, int, int)}
 */
@Deprecated
public EdgeNGramTokenFilter(Version version, TokenStream input, Side side, int minGram, int maxGram) {
  super(input);

  if (version.onOrAfter(Version.LUCENE_4_4) && side == Side.BACK) {
    throw new IllegalArgumentException("Side.BACK is not supported anymore as of Lucene 4.4, use ReverseStringFilter up-front and afterward");
  }

  if (side == null) {
    throw new IllegalArgumentException("sideLabel must be either front or back");
  }

  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }

  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }

  this.version = version;
  this.charUtils = version.onOrAfter(Version.LUCENE_4_4)
      ? CharacterUtils.getInstance(version)
      : CharacterUtils.getJava4Instance();
  this.minGram = minGram;
  this.maxGram = maxGram;
  this.side = side;
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:32，代码来源:EdgeNGramTokenFilter.java

示例10: CharArrayMap

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated Use {@link #CharArrayMap(int, boolean)}
 */
@Deprecated
@SuppressWarnings("unchecked")
public CharArrayMap(Version matchVersion, int startSize, boolean ignoreCase) {
  this.ignoreCase = ignoreCase;
  int size = INIT_SIZE;
  while(startSize + (startSize>>2) > size)
    size <<= 1;
  keys = new char[size][];
  values = (V[]) new Object[size];
  this.charUtils = CharacterUtils.getInstance(matchVersion);
  this.matchVersion = matchVersion;
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:16，代码来源:CharArrayMap.java

示例11: EdgeNGramTokenFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * Creates EdgeNGramTokenFilter that can generate n-grams in the sizes of the given range
 *
 * @param version the <a href="#version">Lucene match version</a>
 * @param input {@link TokenStream} holding the input to be tokenized
 * @param side the {@link Side} from which to chop off an n-gram
 * @param minGram the smallest n-gram to generate
 * @param maxGram the largest n-gram to generate
 */
@Deprecated
public EdgeNGramTokenFilter(Version version, TokenStream input, Side side, int minGram, int maxGram) {
  super(input);

  if (version == null) {
    throw new IllegalArgumentException("version must not be null");
  }

  if (version.onOrAfter(Version.LUCENE_44) && side == Side.BACK) {
    throw new IllegalArgumentException("Side.BACK is not supported anymore as of Lucene 4.4, use ReverseStringFilter up-front and afterward");
  }

  if (side == null) {
    throw new IllegalArgumentException("sideLabel must be either front or back");
  }

  if (minGram < 1) {
    throw new IllegalArgumentException("minGram must be greater than zero");
  }

  if (minGram > maxGram) {
    throw new IllegalArgumentException("minGram must not be greater than maxGram");
  }

  this.version = version;
  this.charUtils = version.onOrAfter(Version.LUCENE_44)
      ? CharacterUtils.getInstance(version)
      : CharacterUtils.getJava4Instance();
  this.minGram = minGram;
  this.maxGram = maxGram;
  this.side = side;
}

开发者ID:yintaoxue，项目名称:read-open-source-code，代码行数:42，代码来源:EdgeNGramTokenFilter.java

示例12: GreekLowerCaseFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated Use {@link #GreekLowerCaseFilter(TokenStream)}
 */
@Deprecated
public GreekLowerCaseFilter(Version matchVersion, TokenStream in) {
  super(in);
  this.charUtils = CharacterUtils.getInstance(matchVersion);
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:9，代码来源:GreekLowerCaseFilter.java

示例13: LowerCaseFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated Use {@link #LowerCaseFilter(TokenStream)}
 */
@Deprecated
public LowerCaseFilter(Version matchVersion, TokenStream in) {
  super(in);
  charUtils = CharacterUtils.getInstance(matchVersion);
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:9，代码来源:LowerCaseFilter.java

示例14: UpperCaseFilter

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
/**
 * @deprecated Use {@link #UpperCaseFilter(TokenStream)}
 */
@Deprecated
public UpperCaseFilter(Version matchVersion, TokenStream in) {
  super(in);
  charUtils = CharacterUtils.getInstance(matchVersion);
}

开发者ID:lamsfoundation，项目名称:lams，代码行数:9，代码来源:UpperCaseFilter.java

示例15: TypeTokenizer

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
public TypeTokenizer(Reader input) {
	super(input);
	charUtils = CharacterUtils.getInstance();
}

开发者ID:gncloud，项目名称:fastcatsearch3，代码行数:5，代码来源:TypeTokenizer.java

示例16: WDSTokenizer

import org.apache.lucene.analysis.util.CharacterUtils; //导入依赖的package包/类
public WDSTokenizer(Reader in, boolean useSmart) {
	offsetAtt = addAttribute(OffsetAttribute.class);
	termAtt = addAttribute(CharTermAttribute.class);
	charUtils = CharacterUtils.getInstance();
}

开发者ID:weidays，项目名称:WDSAnalyzer，代码行数:6，代码来源:WDSTokenizer.java

注：本文中的org.apache.lucene.analysis.util.CharacterUtils类示例整理自Github/MSDocs等源码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Java Filter类代码示例发布时间：2022-05-22

Java ShortArray类代码示例发布时间：2022-05-22

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：18169|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9640|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8165|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8542|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8444|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9366|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8415|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7852|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8398|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7390|2022-11-06

客服电话

电子邮件

Java CharacterUtils类代码示例

示例1: Lucene43EdgeNGramTokenFilter

示例2: init

示例3: MorfologikFilter

示例4: PinyinNGramTokenFilter

示例5: MorfologikFilter

示例6: init

示例7: MorfologikFilter

示例8: Lucene43NGramTokenFilter

示例9: EdgeNGramTokenFilter

示例10: CharArrayMap

示例11: EdgeNGramTokenFilter

示例12: GreekLowerCaseFilter

示例13: LowerCaseFilter

示例14: UpperCaseFilter

示例15: TypeTokenizer

示例16: WDSTokenizer

请发表评论

全部评论

上一篇：

下一篇：

CVE-2022-31513

librespeed/speedtest: Self-hosted Speedt

ozzieperez/packtpub-library-downloader:

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053