Java Dataset类代码示例

OGeek|极客世界-中国程序员成长平台 › 门户 › 编程› Java›Java编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

本文整理汇总了Java中net.sf.javaml.core.Dataset类的典型用法代码示例。如果您正苦于以下问题：Java Dataset类的具体用法？Java Dataset怎么用？Java Dataset使用的例子？那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。

Dataset类属于net.sf.javaml.core包，在下文中一共展示了Dataset类的20个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于我们的系统推荐出更棒的Java代码示例。

示例1: cluster

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
public Dataset[] cluster(Dataset data) {
	Instance[] medoids = new Instance[numberOfClusters];
	Dataset[] output = new DefaultDataset[numberOfClusters];
	for (int i = 0; i < numberOfClusters; i++) {
		int random = rg.nextInt(data.size());
		medoids[i] = data.instance(random);
	}

	boolean changed = true;
	int count = 0;
	while (changed && count < maxIterations) {
		changed = false;
		count++;
		int[] assignment = assign(medoids, data);
		changed = recalculateMedoids(assignment, medoids, output, data);

	}
	System.out.print("Count: " + count + "\n");
	
	this.medoids = medoids;
	return output;

}

开发者ID:taochen，项目名称:ssascaling，代码行数:24，代码来源:CustomKMedoids.java

示例2: assign

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * Assign all instances from the data set to the medoids.
 * 
 * @param medoids candidate medoids
 * @param data the data to assign to the medoids
 * @return best cluster indices for each instance in the data set
 */
private int[] assign(Instance[] medoids, Dataset data) {
	int[] out = new int[data.size()];
	for (int i = 0; i < data.size(); i++) {
		double bestDistance = dm.measure(data.instance(i), medoids[0]);
		int bestIndex = 0;
		for (int j = 1; j < medoids.length; j++) {
			double tmpDistance = dm.measure(data.instance(i), medoids[j]);
			if (dm.compare(tmpDistance, bestDistance)) {
				bestDistance = tmpDistance;
				bestIndex = j;
			}
		}
		out[i] = bestIndex;

	}
	return out;

}

开发者ID:taochen，项目名称:ssascaling，代码行数:26，代码来源:CustomKMedoids.java

示例3: average

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
private Instance average(Dataset set) {
	
	Instance instance = null;
	double fValue = 0.0;
	for (Instance ins : set) {
		double value = 0.0;
		for (Instance subIns : set) {
			if(!ins.equals(subIns)){
				value += dm.measure(ins, subIns);
			}
		}
		
		if (instance == null || value < fValue ){
			instance = ins;
			fValue = value;
		}
	}
	
	return instance;
}

开发者ID:taochen，项目名称:ssascaling，代码行数:21，代码来源:CustomKMedoids.java

示例4: clustering

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
@SuppressWarnings("rawtypes")
@Override
public List[] clustering(List<Objective> objectives) {
	Dataset ds = new DefaultDataset();
	for (Objective obj : objectives) {
		ds.add(new DenseInstance(obj.getArray(),obj));
	}
	long time = System.currentTimeMillis();
	//SpearmanRankCorrelation sc = new SpearmanRankCorrelation();
	//System.out.print("Correlation " + sc.measure(ds.get(1), ds.get(2)) + "\n");
	//SpearmanRankCorrelation
	CustomKMean ckm = new CustomKMean(2, 1000, new SpearmanDistance());
	Dataset[] clusters = ckm.cluster(ds);
	System.out.print("Time taken on clustering: " + ( System.currentTimeMillis() - time) + "\n");
	
	return clusters;
}

开发者ID:taochen，项目名称:ssascaling，代码行数:18，代码来源:JavaMLNeighborhood.java

示例5: main

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * Tests the k-means algorithm with default parameter settings.
 */
public static void main(String[] args) throws Exception {

    /* Load a dataset */
    Dataset data = FileHandler.loadDataset(new File("devtools/data/iris.data"), 4, ",");
    /*
     * Create a new instance of the KMeans algorithm, with no options
     * specified. By default this will generate 4 clusters.
     */
    Clusterer km = new KMeans();
    /*
     * Cluster the data, it will be returned as an array of data sets, with
     * each dataset representing a cluster
     */
    Dataset[] clusters = km.cluster(data);
    System.out.println("Cluster count: " + clusters.length);

    
    
    
    
}

开发者ID:jaimeguzman，项目名称:data_mining，代码行数:25，代码来源:TutorialKMeans.java

示例6: cluster

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * XXX add doc
 */
public Dataset[] cluster(Dataset data) {
    KMeans km = new KMeans(this.kMin, this.iterations, this.dm);
    Dataset[] bestClusters = km.cluster(data);
    double bestScore = this.ce.score(bestClusters);
    for (int i = kMin + 1; i <= kMax; i++) {
        km = new KMeans(i, this.iterations, this.dm);
        Dataset[] tmpClusters = km.cluster(data);
        double tmpScore = this.ce.score(tmpClusters);
        if (this.ce.compareScore(bestScore, tmpScore)) {
            bestScore = tmpScore;
            bestClusters = tmpClusters;
        }
    }
    return bestClusters;
}

开发者ID:eracle，项目名称:gap，代码行数:19，代码来源:IterativeKMeans.java

示例7: assign

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * Assign all instances from the data set to the medoids.
 * 
 * @param medoids candidate medoids
 * @param data the data to assign to the medoids
 * @return best cluster indices for each instance in the data set
 */
private int[] assign(Instance[] medoids, Dataset data) {
	LOGGER.log( Level.INFO, "Assign all instances from the data set to the medoids.");
	int[] out = new int[data.size()];
	for (int i = 0; i < data.size(); i++) {
		double bestDistance = dm.measure(data.instance(i), medoids[0]);
		int bestIndex = 0;
		for (int j = 1; j < medoids.length; j++) {
			double tmpDistance = dm.measure(data.instance(i), medoids[j]);
			LOGGER.log(Level.FINE, "Distance:{0}",tmpDistance);
			if (dm.compare(tmpDistance, bestDistance)) {
				bestDistance = tmpDistance;
				bestIndex = j;
			}
		}
		out[i] = bestIndex;

	}
	return out;

}

开发者ID:eracle，项目名称:gap，代码行数:28，代码来源:KMedoids.java

示例8: recalculateMedoids

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * Return a array with on each position the clusterIndex to which the
 * Instance on that position in the dataset belongs.
 * 
 * @param medoids
 *            the current set of cluster medoids, will be modified to fit
 *            the new assignment
 * @param assignment
 *            the new assignment of all instances to the different medoids
 * @param output
 *            the cluster output, this will be modified at the end of the
 *            method
 * @return the
 */
public boolean recalculateMedoids(int[] assignment, Instance[] medoids,
		Dataset[] output, Dataset data) {
	boolean changed = false;
	for (int i = 0; i < numberOfClusters; i++) {
		output[i] = new DefaultDataset();
		for (int j = 0; j < assignment.length; j++) {
			if (assignment[j] == i) {
				output[i].add(data.instance(j));
			}
		}
		if (output[i].size() == 0) { // new random, empty medoid
			medoids[i] = data.instance(rg.nextInt(data.size()));
			changed = true;
		} else {
			Instance centroid = DatasetTools.average(output[i]);
			Instance oldMedoid = medoids[i];
			medoids[i] = data.kNearest(1, centroid, dm).iterator().next();
			if (!medoids[i].equals(oldMedoid))
				changed = true;
		}
	}
	return changed;
}

开发者ID:eracle，项目名称:gap，代码行数:38，代码来源:KMedoids.java

示例9: score

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * XXX DOC
 */
public double score(Dataset[] datas) {
   
    double sum=0;
    for(int i=0;i<datas.length;i++){
        double tmpSum=0;
        for(int j=0;j<datas[i].size();j++){
            for(int k=0;k<datas[i].size();k++){
                double error=dm.measure(datas[i].instance(j),datas[i].instance(k));
                tmpSum+=error;
            }  
        }
        sum+=tmpSum/datas[i].size();
    }
   return sum;
}

开发者ID:eracle，项目名称:gap，代码行数:19，代码来源:SumOfAveragePairwiseSimilarities.java

示例10: score

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
    * XXX DOC
    */
public double score(Dataset[] datas) {

	Instance[] centroids = new Instance[datas.length];
	for (int i = 0; i < datas.length; i++) {
		centroids[i] = DatasetTools.average(datas[i]);
	}
	double sum = 0;
	for (int i = 0; i < datas.length; i++) {
		for (int j = 0; j < datas[i].size(); j++) {
			double error = dm.measure(datas[i].instance(j),
					centroids[i]);
			sum += error;
		}
	}
	return sum;
}

开发者ID:eracle，项目名称:gap，代码行数:20，代码来源:SumOfCentroidSimilarities.java

示例11: score

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
public double score(Dataset[] clusters) {
	// number of free parameters K
	double k = 1;
	// sampelsize N
	double datasize = 0;

	for (int i = 0; i < clusters.length; i++) {
		datasize += clusters[i].size();
	}
	LogLikelihoodFunction likelihood = new LogLikelihoodFunction();
	// loglikelihood log(L)
	double l = likelihood.loglikelihoodsum(clusters);
	// BIC score
	double bic = -2 * l + Math.log10(datasize) * k;
	return bic;
}

开发者ID:eracle，项目名称:gap，代码行数:17，代码来源:BICScore.java

示例12: cluster

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
    * XXX add doc
    */
public Dataset[] cluster(Dataset data) {
	KMeans km = new KMeans(this.clusters, this.iterations,
			this.dm);
	Dataset[] bestClusters = km.cluster(data);
	double bestScore = this.ce.score(bestClusters);
	for (int i = 0; i < repeats; i++) {
		Dataset[] tmpClusters = km.cluster(data);
		double tmpScore = this.ce.score(tmpClusters);
		if (this.ce.compareScore(bestScore, tmpScore)) {
			bestScore = tmpScore;
			bestClusters = tmpClusters;
		}
	}
	return bestClusters;
}

开发者ID:eracle，项目名称:gap，代码行数:19，代码来源:MultiKMeans.java

示例13: transformDataset

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
private static svm_problem transformDataset(Dataset data) {
	svm_problem p = new svm_problem();
	p.l = data.size();
	p.y = new double[data.size()];
	p.x = new svm_node[data.size()][];
	int tmpIndex = 0;
	for (int j = 0; j < data.size(); j++) {
		Instance tmp = data.instance(j);
		p.y[tmpIndex] = data.classIndex(tmp.classValue());
		p.x[tmpIndex] = new svm_node[tmp.keySet().size()];
		int i = 0;
		SortedSet<Integer> tmpSet = tmp.keySet();
		for (int index : tmpSet) {
			p.x[tmpIndex][i] = new svm_node();
			p.x[tmpIndex][i].index = index;
			p.x[tmpIndex][i].value = tmp.value(index);
			i++;
		}
		tmpIndex++;
	}
	return p;
}

开发者ID:eracle，项目名称:gap，代码行数:23，代码来源:LibSVM.java

示例14: cluster

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
public Dataset[] cluster(Dataset data) {

        filter.filter(data);
        m_numberOfClusters = -1;
        m_cobwebTree = null;
        m_numberSplits = 0;
        m_numberMerges = 0;
        for (int i = 0; i < data.size(); i++) {
            updateClusterer(data.instance(i));
        }
        determineNumberOfClusters();
        // printNode(m_cobwebTree, 0);

        Vector<Dataset> clusters = new Vector<Dataset>();
        createClusters(m_cobwebTree, clusters);
        Dataset[] out = new Dataset[clusters.size()];
        clusters.toArray(out);
        return out;
    }

开发者ID:eracle，项目名称:gap，代码行数:20，代码来源:Cobweb.java

示例15: logLikelihood

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
public double logLikelihood(Dataset cluster) {
	double instanceLength = cluster.instance(0).size();
	this.count = instanceLength * cluster.size();
	sum = 0;
	sum2 = 0;

	for (int row = 0; row < cluster.size(); row++) {
		for (int column = 0; column < instanceLength; column++) {
			sum += cluster.instance(row).value(column);
			sum2 += cluster.instance(row).value(column)
					* cluster.instance(row).value(column);
		}
	}

	double loglikelihood = logLikelihoodFunction(count, sum, sum2);
	if (loglikelihood == Double.NEGATIVE_INFINITY
			|| loglikelihood == Double.POSITIVE_INFINITY) {
		loglikelihood = 0;
	}
	return (loglikelihood);
}

开发者ID:eracle，项目名称:gap，代码行数:22，代码来源:LogLikelihoodFunction.java

示例16: buildClassifier

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
public void buildClassifier(Dataset data) {
	this.dataReference = data;
	int t = 0, f = 0;
	for (int i = 0; i < classifiers.length; i++) {
		Pair<Dataset, Dataset>sample = samplingMethod.sample(data,data
				.size(), seed++);
		classifiers[i].buildClassifier(sample.x());
		if (calculateOutOfBagErrorEstimate) {
			for (Instance inst : sample.y()) {
				Object predClass = classifiers[i].classify(inst);
				if (predClass.equals(inst.classValue())) {
					t++;
				} else {
					f++;
				}
			}
			outOfBagErrorEstimate = t / (t + f);
			
		}
		
	}
	

}

开发者ID:eracle，项目名称:gap，代码行数:25，代码来源:Bagging.java

示例17: buildClassifier

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
@Override
public void buildClassifier(Dataset data) {
    super.buildClassifier(data);
    mean = new HashMap<Object, Instance>();
    HashMap<Object, Integer> count = new HashMap<Object, Integer>();
    for (Instance i : data) {
        if (!mean.containsKey(i.classValue())) {
            mean.put(i.classValue(), i);
            count.put(i.classValue(), 1);
        } else {
            mean.put(i.classValue(), mean.get(i.classValue()).add(i));
            count.put(i.classValue(), count.get(i.classValue()) + 1);
        }
    }
    for (Object o : mean.keySet()) {
        mean.put(o, mean.get(o).divide(count.get(o)));
    }

}

开发者ID:eracle，项目名称:gap，代码行数:20，代码来源:AbstractMeanClassifier.java

示例18: maxAttributes

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
/**
 * Create an instance that contains all the maximum values for the
 * attributes.
 * 
 * @param data
 *            data set to find minimum attribute values for
 * @return Instance representing the minimum values for each attribute
 */
public static Instance maxAttributes(Dataset data) {
	Instance max = new SparseInstance();
	for (Instance i : data) {
		for (Integer index : i.keySet()) {
			double val = i.value(index);
			if (!max.containsKey(index))
				max.put(index, val);
			else if (max.get(index) < val)
				max.put(index, val);

		}

	}
	return max;
}

开发者ID:eracle，项目名称:gap，代码行数:24，代码来源:DatasetTools.java

示例19: build

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
@Override
public void build(Dataset data) {
    weights = new double[data.noAttributes()];

    /* Normalize the data to [0,1] */

    NormalizeMidrange dnm = new NormalizeMidrange(0.5, 1);
    dnm.filter(data);

    /* Number of iterations */
    int m = data.size();

    for (int i = 0; i < m; i++) {
        Instance random = data.instance(rg.nextInt(data.size()));
        findNearest(data, random);
        for (int j = 0; j < weights.length; j++)
            weights[j] = weights[j] - diff(j, random, nearestHit) / m + diff(j, random, nearestMiss) / m;

    }
}

开发者ID:eracle，项目名称:gap，代码行数:21，代码来源:RELIEF.java

示例20: build

import net.sf.javaml.core.Dataset; //导入依赖的package包/类
@Override
public void build(Dataset data) {
    /*
     * When more attributes should be selected then there are, return all
     * attributes.
     */
    if (n > data.noAttributes()) {
        selectedAttributes = data.get(0).keySet();
        return;
    }
    /*
     * Regular procedure, add iteratively the best attribute till we have
     * enough attributes selected.
     */
    Instance classInstance = DatasetTools.createInstanceFromClass(data);
    selectedAttributes = new HashSet<Integer>();
    while (selectedAttributes.size() < n) {
        selectNext(data, classInstance);
    }

}

开发者ID:eracle，项目名称:gap，代码行数:22，代码来源:GreedyForwardSelection.java

注：本文中的net.sf.javaml.core.Dataset类示例整理自Github/MSDocs等源码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Java TabixIndex类代码示例发布时间：2022-05-23

Java PerFieldSimilarityWrapper类代码示例发布时间：2022-05-23

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：18061|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9606|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8146|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8530|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8430|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9340|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8394|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7831|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8382|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7379|2022-11-06

客服电话

电子邮件

Java Dataset类代码示例

示例1: cluster

示例2: assign

示例3: average

示例4: clustering

示例5: main

示例6: cluster

示例7: assign

示例8: recalculateMedoids

示例9: score

示例10: score

示例11: score

示例12: cluster

示例13: transformDataset

示例14: cluster

示例15: logLikelihood

示例16: buildClassifier

示例17: buildClassifier

示例18: maxAttributes

示例19: build

示例20: build

请发表评论

全部评论

上一篇：

下一篇：

librespeed/speedtest: Self-hosted Speedt

CVE-2022-30275

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

medfreeman/markdown-it-toc-and-anchor: m

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053