Sequencer:一种检测复杂数据集中的一维序列的算法

时间:2024-05-04 03:14:51
【文件属性】:

文件名称:Sequencer:一种检测复杂数据集中的一维序列的算法

文件大小:55.77MB

文件格式:ZIP

更新时间:2024-05-04 03:14:51

Python

音序器 一种检测复杂数据集中的一维趋势(=序列)的算法。 概述 Sequencer是一种尝试揭示数据集中主要序列(如果存在)的算法。 为此,它对集合中的对象进行重新排序,以产生描述其相似性的最伸长的歧管,这些相似性以多尺度方式并使用度量标准集合进行测量。 一般而言,它结合了来自四个不同度量的信息:欧氏距离,Kullback-Leibler发散度,Monge-Wasserstein或地球移动器距离以及能量距离。 它通过将输入数据中的每个对象划分为单独的部分(块),并估计块之间的成对相似性,来考虑数据的不同尺度。 然后,它将每个块中的信息汇总到每个度量标准和规模的单个估算器中。 定序器使用描述多尺度相似性的图的形状。 特别是,它利用这样一个事实,即数据集中的连续趋势(序列)会导致图形变长。 通过将图的伸长率定义为品质因数,Sequencer可以优化其超参数(距离度量和小数位数),并选择对数据


【文件预览】:
Sequencer-master
----sequencer()
--------sequencer_.py(71KB)
--------distance_metrics.py(13KB)
--------__init__.py(66B)
--------elongation_estimation.py(4KB)
----images()
--------natural_image_example.png(277KB)
--------synthetic_data_seq_box_plots.png(840KB)
----requirements.txt(71B)
----examples()
--------beyond_1D_sequence.ipynb(876KB)
--------examples_with_natural_images.ipynb(2.8MB)
--------basic_sequencer_functionalities.ipynb(190KB)
--------importance_of_multi_scale_approach.ipynb(587KB)
--------comparison_with_tsne_and_umap.ipynb(2.08MB)
--------sequencer_output_directory()
--------data_for_examples()
--------two_dimensional_objects.ipynb(869KB)
--------visualizing_the_MST.ipynb(592KB)
----LICENSE(1KB)
----setup.py(1KB)
----README.md(15KB)
----.gitignore(225B)
----Sequencer_paper.pdf(11.41MB)

网友评论