Java AccumuloFileOutputFormat类代码示例

OGeek|极客世界-中国程序员成长平台 › 门户 › 编程› Java›Java编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

本文整理汇总了Java中org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat类的典型用法代码示例。如果您正苦于以下问题：Java AccumuloFileOutputFormat类的具体用法？Java AccumuloFileOutputFormat怎么用？Java AccumuloFileOutputFormat使用的例子？那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。

AccumuloFileOutputFormat类属于org.apache.accumulo.core.client.mapreduce包，在下文中一共展示了AccumuloFileOutputFormat类的9个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于我们的系统推荐出更棒的Java代码示例。

示例1: getHadoopOF

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
/**
 * creates output format to write data from flink DataSet to accumulo
 * @return
 * @throws AccumuloSecurityException
 */
public HadoopOutputFormat getHadoopOF() throws AccumuloSecurityException, IOException {

    if(job == null){
        job = Job.getInstance(new Configuration(), jobName);
    }
    AccumuloOutputFormat.setConnectorInfo(job, accumuloUser, new PasswordToken(accumuloPassword));
    ClientConfiguration clientConfig = new ClientConfiguration();
    clientConfig.withInstance(accumuloInstanceName);
    clientConfig.withZkHosts(accumuloZookeeper);
    AccumuloOutputFormat.setZooKeeperInstance(job, clientConfig);
    AccumuloOutputFormat.setDefaultTableName(job, outTable);
    AccumuloFileOutputFormat.setOutputPath(job,new Path("/tmp"));

    HadoopOutputFormat<Text, Mutation> hadoopOF =
            new HadoopOutputFormat<>(new AccumuloOutputFormat() , job);
    return hadoopOF;
}

开发者ID:IIDP，项目名称:OSTMap，代码行数:23，代码来源:FlinkEnvManager.java

示例2: run

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Override
public int run(String[] args) {
  Opts opts = new Opts();
  opts.parseArgs(BulkIngestExample.class.getName(), args);

  Configuration conf = getConf();
  PrintStream out = null;
  try {
    Job job = Job.getInstance(conf);
    job.setJobName("bulk ingest example");
    job.setJarByClass(this.getClass());

    job.setInputFormatClass(TextInputFormat.class);

    job.setMapperClass(MapClass.class);
    job.setMapOutputKeyClass(Text.class);
    job.setMapOutputValueClass(Text.class);

    job.setReducerClass(ReduceClass.class);
    job.setOutputFormatClass(AccumuloFileOutputFormat.class);
    opts.setAccumuloConfigs(job);

    Connector connector = opts.getConnector();

    TextInputFormat.setInputPaths(job, new Path(opts.inputDir));
    AccumuloFileOutputFormat.setOutputPath(job, new Path(opts.workDir + "/files"));

    FileSystem fs = FileSystem.get(conf);
    out = new PrintStream(new BufferedOutputStream(fs.create(new Path(opts.workDir + "/splits.txt"))));

    Collection<Text> splits = connector.tableOperations().listSplits(opts.getTableName(), 100);
    for (Text split : splits)
      out.println(Base64.getEncoder().encodeToString(TextUtil.getBytes(split)));

    job.setNumReduceTasks(splits.size() + 1);
    out.close();

    job.setPartitionerClass(RangePartitioner.class);
    RangePartitioner.setSplitFile(job, opts.workDir + "/splits.txt");

    job.waitForCompletion(true);
    Path failures = new Path(opts.workDir, "failures");
    fs.delete(failures, true);
    fs.mkdirs(new Path(opts.workDir, "failures"));
    // With HDFS permissions on, we need to make sure the Accumulo user can read/move the rfiles
    FsShell fsShell = new FsShell(conf);
    fsShell.run(new String[] {"-chmod", "-R", "777", opts.workDir});
    connector.tableOperations().importDirectory(opts.getTableName(), opts.workDir + "/files", opts.workDir + "/failures", false);

  } catch (Exception e) {
    throw new RuntimeException(e);
  } finally {
    if (out != null)
      out.close();
  }

  return 0;
}

开发者ID:apache，项目名称:accumulo-examples，代码行数:59，代码来源:BulkIngestExample.java

示例3: bulkImportKvToAccumulo

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
/**
 * Bulk import Key/Value data into specified Accumulo table. This method does not repartition
 * data. One RFile will be created for each partition in the passed in RDD. Ensure the RDD is
 * reasonably partitioned before calling this method.
 *
 * @param data Key/value data to import
 * @param accumuloTable Accumulo table used for import
 * @param opts Bulk import options
 */
public void bulkImportKvToAccumulo(JavaPairRDD<Key, Value> data, String accumuloTable,
    BulkImportOptions opts) {

  Path tempDir = getTempDir(opts);
  Connector conn = chooseConnector(opts);

  try {
    if (hdfs.exists(tempDir)) {
      throw new IllegalArgumentException("HDFS temp dir already exists: " + tempDir.toString());
    }
    hdfs.mkdirs(tempDir);
    Path dataDir = new Path(tempDir.toString() + "/data");
    Path failDir = new Path(tempDir.toString() + "/fail");
    hdfs.mkdirs(failDir);

    // save data to HDFS
    Job job = Job.getInstance(hadoopConfig);
    AccumuloFileOutputFormat.setOutputPath(job, dataDir);
    // must use new API here as saveAsHadoopFile throws exception
    data.saveAsNewAPIHadoopFile(dataDir.toString(), Key.class, Value.class,
        AccumuloFileOutputFormat.class, job.getConfiguration());

    // bulk import data to Accumulo
    log.info("Wrote data for bulk import to HDFS temp directory: {}", dataDir);
    conn.tableOperations().importDirectory(accumuloTable, dataDir.toString(), failDir.toString(),
        false);

    // throw exception if failures directory contains files
    if (hdfs.listFiles(failDir, true).hasNext()) {
      throw new IllegalStateException("Bulk import failed!  Found files that failed to import "
          + "in failures directory: " + failDir);
    }
    log.info("Successfully bulk imported data in {} to '{}' Accumulo table", dataDir,
        accumuloTable);

    // delete data directory
    hdfs.delete(tempDir, true);
    log.info("Deleted HDFS temp directory created for bulk import: {}", tempDir);
    // @formatter:off
  } catch (IOException | TableNotFoundException | AccumuloException
      | AccumuloSecurityException e) {
    // @formatter:on
    throw new IllegalStateException(e);
  }
}

开发者ID:apache，项目名称:fluo-recipes，代码行数:55，代码来源:FluoSparkHelper.java

示例4: setupOutput

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
protected void setupOutput(final Job job, final AddElementsFromHdfs operation) {
    job.setOutputFormatClass(AccumuloFileOutputFormat.class);
    FileOutputFormat.setOutputPath(job, new Path(operation.getOutputPath()));
}

开发者ID:gchq，项目名称:Gaffer，代码行数:5，代码来源:AccumuloAddElementsFromHdfsJobFactory.java

示例5: shouldSetupJob

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Test
public void shouldSetupJob() throws IOException {
    // Given
    final JobConf localConf = createLocalConf();
    final FileSystem fs = FileSystem.getLocal(localConf);
    fs.mkdirs(new Path(outputDir));
    fs.mkdirs(new Path(splitsDir));
    try (final BufferedWriter writer = new BufferedWriter(new OutputStreamWriter(fs.create(new Path(splitsFile), true)))) {
        writer.write("1");
    }

    final AccumuloAddElementsFromHdfsJobFactory factory = new AccumuloAddElementsFromHdfsJobFactory();
    final Job job = mock(Job.class);
    final AddElementsFromHdfs operation = new AddElementsFromHdfs.Builder()
            .outputPath(outputDir)
            .addInputMapperPair(inputDir, TextMapperGeneratorImpl.class.getName())
            .useProvidedSplits(true)
            .splitsFilePath(splitsFile)
            .build();
    final AccumuloStore store = mock(AccumuloStore.class);

    given(job.getConfiguration()).willReturn(localConf);

    // When
    factory.setupJob(job, operation, TextMapperGeneratorImpl.class.getName(), store);

    // Then
    verify(job).setJarByClass(factory.getClass());
    verify(job).setJobName(String.format(AccumuloAddElementsFromHdfsJobFactory.INGEST_HDFS_DATA_GENERATOR_S_OUTPUT_S, TextMapperGeneratorImpl.class.getName(), outputDir));

    verify(job).setMapperClass(AddElementsFromHdfsMapper.class);
    verify(job).setMapOutputKeyClass(Key.class);
    verify(job).setMapOutputValueClass(Value.class);

    verify(job).setCombinerClass(AccumuloKeyValueReducer.class);

    verify(job).setReducerClass(AccumuloKeyValueReducer.class);
    verify(job).setOutputKeyClass(Key.class);
    verify(job).setOutputValueClass(Value.class);

    job.setOutputFormatClass(AccumuloFileOutputFormat.class);
    assertEquals(fs.makeQualified(new Path(outputDir)).toString(), job.getConfiguration().get("mapreduce.output.fileoutputformat.outputdir"));

    verify(job).setNumReduceTasks(2);
    verify(job).setPartitionerClass(GafferKeyRangePartitioner.class);
    assertEquals(splitsFile, job.getConfiguration().get(GafferRangePartitioner.class.getName() + ".cutFile"));
}

开发者ID:gchq，项目名称:Gaffer，代码行数:48，代码来源:AccumuloAddElementsFromHdfsJobFactoryTest.java

示例6: prepareKeyValues

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Override
protected void prepareKeyValues(final ImportKeyValuePairRDDToAccumulo operation, final AccumuloKeyRangePartitioner partitioner) throws OperationException {
    final OrderedRDDFunctions orderedRDDFunctions = new OrderedRDDFunctions(operation.getInput(), ORDERING_CLASS_TAG, KEY_CLASS_TAG, VALUE_CLASS_TAG, scala.reflect.ClassTag$.MODULE$.apply(Tuple2.class));
    final PairRDDFunctions pairRDDFunctions = new PairRDDFunctions(orderedRDDFunctions.repartitionAndSortWithinPartitions(partitioner), KEY_CLASS_TAG, VALUE_CLASS_TAG, ORDERING_CLASS_TAG);
    pairRDDFunctions.saveAsNewAPIHadoopFile(operation.getOutputPath(), Key.class, Value.class, AccumuloFileOutputFormat.class, getConfiguration(operation));
}

开发者ID:gchq，项目名称:Gaffer，代码行数:7，代码来源:ImportKeyValuePairRDDToAccumuloHandler.java

示例7: prepareKeyValues

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Override
protected void prepareKeyValues(final ImportKeyValueJavaPairRDDToAccumulo operation, final AccumuloKeyRangePartitioner partitioner) throws OperationException {
    final JavaPairRDD<Key, Value> rdd = operation.getInput().repartitionAndSortWithinPartitions(partitioner);
    rdd.saveAsNewAPIHadoopFile(operation.getOutputPath(), Key.class, Value.class, AccumuloFileOutputFormat.class, getConfiguration(operation));
}

开发者ID:gchq，项目名称:Gaffer，代码行数:6，代码来源:ImportKeyValueJavaPairRDDToAccumuloHandler.java

示例8: run

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Override
public int run(
		final String[] args )
		throws Exception {

	final Configuration conf = getConf();
	conf.set(
			"fs.defaultFS",
			"file:///");

	final Job job = Job.getInstance(
			conf,
			JOB_NAME);
	job.setJarByClass(getClass());

	FileInputFormat.setInputPaths(
			job,
			new Path(
					TEST_DATA_LOCATION));
	FileOutputFormat.setOutputPath(
			job,
			cleanPathForReuse(
					conf,
					OUTPUT_PATH));

	job.setMapperClass(SimpleFeatureToAccumuloKeyValueMapper.class);
	job.setReducerClass(Reducer.class); // (Identity Reducer)

	job.setInputFormatClass(GeonamesDataFileInputFormat.class);
	job.setOutputFormatClass(AccumuloFileOutputFormat.class);

	job.setMapOutputKeyClass(Key.class);
	job.setMapOutputValueClass(Value.class);
	job.setOutputKeyClass(Key.class);
	job.setOutputValueClass(Value.class);

	job.setNumReduceTasks(1);
	job.setSpeculativeExecution(false);

	final boolean result = job.waitForCompletion(true);

	mapInputRecords = job.getCounters().findCounter(
			TASK_COUNTER_GROUP_NAME,
			MAP_INPUT_RECORDS).getValue();

	mapOutputRecords = job.getCounters().findCounter(
			TASK_COUNTER_GROUP_NAME,
			MAP_OUTPUT_RECORDS).getValue();

	return result ? 0 : 1;
}

开发者ID:locationtech，项目名称:geowave，代码行数:52，代码来源:BulkIngestInputGenerationIT.java

示例9: testImportFile

import org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat; //导入依赖的package包/类
@Test
public void testImportFile() throws Exception {

  File inDir = new File(tempFolder.getRoot(), "in");
  inDir.mkdir();
  File outDir = new File(tempFolder.getRoot(), "out");
  File failDir = new File(tempFolder.getRoot(), "fail");
  failDir.mkdir();

  // generate some data for map reduce to read
  PrintWriter writer =
      new PrintWriter(new File(inDir, "file1.txt"), StandardCharsets.UTF_8.name());
  writer.println("a,b,c,1");
  writer.println("d,b,c,2");
  writer.println("foo,moo,moo,90");
  writer.close();

  // run map reduce job to generate rfiles
  JobConf jconf = new JobConf();
  jconf.set("mapred.job.tracker", "true");
  jconf.set("fs.defaultFS", "file:///");
  @SuppressWarnings("deprecation")
  Job job = new Job(jconf);
  job.setInputFormatClass(TextInputFormat.class);
  FileInputFormat.setInputPaths(job, inDir.toURI().toString());
  job.setOutputFormatClass(AccumuloFileOutputFormat.class);
  AccumuloFileOutputFormat.setOutputPath(job, new Path(outDir.toURI()));
  job.setMapperClass(TestMapper.class);
  job.setNumReduceTasks(0);
  Assert.assertTrue(job.waitForCompletion(false));

  // bulk import rfiles
  conn.tableOperations().importDirectory(table, outDir.toString(), failDir.toString(), false);

  // read and update data using transactions
  TestTransaction tx1 = new TestTransaction(env);
  TestTransaction tx2 = new TestTransaction(env);

  Assert.assertEquals("1", tx1.gets("a", new Column("b", "c")));
  Assert.assertEquals("2", tx1.gets("d", new Column("b", "c")));
  Assert.assertEquals("90", tx1.gets("foo", new Column("moo", "moo")));

  tx1.set("a", new Column("b", "c"), "3");
  tx1.delete("d", new Column("b", "c"));

  tx1.done();

  // should not see changes from tx1
  Assert.assertEquals("1", tx2.gets("a", new Column("b", "c")));
  Assert.assertEquals("2", tx2.gets("d", new Column("b", "c")));
  Assert.assertEquals("90", tx2.gets("foo", new Column("moo", "moo")));

  TestTransaction tx3 = new TestTransaction(env);

  // should see changes from tx1
  Assert.assertEquals("3", tx3.gets("a", new Column("b", "c")));
  Assert.assertNull(tx3.gets("d", new Column("b", "c")));
  Assert.assertEquals("90", tx3.gets("foo", new Column("moo", "moo")));
}

开发者ID:apache，项目名称:fluo，代码行数:60，代码来源:FluoFileOutputFormatIT.java

注：本文中的org.apache.accumulo.core.client.mapreduce.AccumuloFileOutputFormat类示例整理自Github/MSDocs等源码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Java FastAdapter类代码示例发布时间：2022-05-22

Java MyContainerManager类代码示例发布时间：2022-05-22

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：18229|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9664|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8174|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8546|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8452|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9377|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8422|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7855|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8407|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7393|2022-11-06

客服电话

电子邮件

Java AccumuloFileOutputFormat类代码示例

示例1: getHadoopOF

示例2: run

示例3: bulkImportKvToAccumulo

示例4: setupOutput

示例5: shouldSetupJob

示例6: prepareKeyValues

示例7: prepareKeyValues

示例8: run

示例9: testImportFile

请发表评论

全部评论

上一篇：

下一篇：

covid-tracing-mongolia/mobile: COVID Tra

joaomh/curso-de-matlab

夏的笔顺,认识夏的笔画,诠释夏的部首

rugk/mastodon-simplified-federation: Sim

AltraMayor/XIA-for-Linux: XIA implementa

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053