Getting different results on the same data set

Hi,

Am I supposed to get different clustering result from each run on the same data set? I was running the following code:

univariate_ts_datasets = np.expand_dims(np.random.rand(200, 60), axis=2)
num_clusters = 3

# CPU Model
for j in range(5):
    ksc = KShapeClusteringCPU(num_clusters, centroid_init='zero', max_iter=100, n_jobs=-1)
    ksc.fit(univariate_ts_datasets)
    
    labels = ksc.labels_ # or ksc.predict(univariate_ts_datasets)
    cluster_centroids = ksc.centroids_
    print(labels)

My understanding is that there's nothing random in the algo since I set the centroid init to be zero. But I get different results, e.g. sometimes the first ts and second ts belong to the same cluster and sometimes they don't

Thanks,
James

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Getting different results on the same data set #17

CPU Model

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Getting different results on the same data set #17

Description

CPU Model

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions