Apa yang dilakukan np corrcoef dengan python?

Tutorial ini menunjukkan fungsi korelasi np.corrcoef[]_ fungsi dari perpustakaan NumPy di ​​Python

Korelasi dalam NumPy

Koefisien korelasi adalah nilai bernomor yang menunjukkan hubungan antara fitur yang diberikan dari kumpulan data

Korelasi bisa positif, artinya mereka memiliki hubungan langsung, dan peningkatan satu fitur akan mengarah ke fitur lainnya. Korelasi negatif juga dimungkinkan, menunjukkan bahwa kedua fitur memiliki hubungan terbalik satu sama lain, yang berarti bahwa kenaikan satu fitur akan menyebabkan penurunan fitur lainnya.

Berikut ini adalah beberapa berbagai korelasi

  • Korelasi Pearson
  • Korelasi Kendall
  • Korelasi Spearman

Namun, fungsi pustaka NumPy np.corrcoef[] hanya berfokus pada dan menghitung nilai korelasi Pearson. Korelasi lainnya dapat ditemukan menggunakan fungsi langsung yang disediakan oleh perpustakaan SciPy

Tutorial ini hanya berfokus pada fungsi np.coefcorr[] dan implementasinya

Gunakan Fungsi np.corrcoef[]_ untuk Menerapkan Korelasi dengan Python

Fungsi np.corrcoef[] dari pustaka NumPy digunakan untuk mendapatkan matriks koefisien korelasi Pearson antara dua larik mana pun, asalkan kedua larik memiliki bentuk yang sama. Fungsi ini umumnya mengembalikan array dua dimensi, yang menggambarkan koefisien korelasi

Impor pustaka NumPy ke kode Python untuk mengimplementasikan fungsi ini tanpa menghadapi kesalahan apa pun

Kode Contoh

import numpy as np
a=np.arange[20,30]
b=np.array[[8,12,29,33,60,48,21,44,78,96]]
x=np.corrcoef[a,b]
print[x]

Keluaran

[[1.          0.82449488]
 [0.82449488  1.        ]]
_

Diagonal utama matriks keluaran selalu memiliki semua nilai sebagai satu. Dalam kasus kita, nilai elemen kiri atas adalah satu karena mengembalikan koefisien korelasi x dengan x, dan elemen kanan bawah mengembalikan koefisien korelasi y dengan y

Nilai utama yang perlu diperhatikan dari matriks keluaran yang diberikan adalah dua nilai lainnya. Nilai ini menjadi perkiraan 0.82 untuk kasus kita. Apalagi kedua elemen ini selalu memiliki nilai yang sama

Gunakan Korelasi Dengan Perpustakaan Matplotlib untuk Membuat Grafik Korelasi

Pustaka NumPy juga dapat digunakan bersama pustaka Matplotlib, memungkinkan pengguna untuk memiliki grafik korelasi sebagai keluaran. Kode berikut menggunakan fungsi korelasi

[[1.          0.82449488]
 [0.82449488  1.        ]]
0 dengan library Matplotlib untuk membuat grafik korelasi

Kode Contoh

import numpy as np
x=np.arange[20,30]
y=np.array[[8,12,29,33,60,48,21,44,78,96]]
print[np.corrcoef[x,y]]
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline
matplotlib.style.use['ggplot']
plt.scatter[x, y]
plt.show[]

Keluaran

Grafik di atas menunjukkan korelasi positif karena grafik tersebut tampaknya memiliki lintasan umum ke atas. Jenis grafik ini berfungsi lebih baik untuk lebih banyak elemen dalam array yang diberikan

Di sini kita bisa mendapatkan koefisien korelasi a,b [0. 995], a,c [-0. 981] dan b,c [-0. 972] sekaligus. Kasing dua-data-set hanyalah kasus khusus dari kelas N-data-set. Dan mungkin lebih baik mempertahankan jenis pengembalian yang sama. Karena "satu nilai" dapat diperoleh hanya dengan

>>> corrcoef[a,b][1,0]
0.99535001355530017
_

tidak ada alasan besar untuk membuat kasus khusus

Salah satu istilah penting saat mempelajari korelasi adalah koefisien korelasi. Koefisien korelasi adalah ukuran statistik dari perubahan dalam satu variabel yang ditentukan oleh variabel lain. Secara sederhana dapat dikatakan bahwa tingkat intensitas hubungan antara dua variabel ditentukan oleh koefisien korelasi

Korelasi positif. Hubungan antara dua variabel dimana kedua variabel tersebut mengalami penurunan atau peningkatan

Korelasi negatif. Hubungan antara dua variabel dimana jika salah satu variabel berubah maka variabel lainnya berubah secara terbalik i. e. jika variabel1 meningkat maka variabel2 menurun

Ada korelasi berbeda yang didefinisikan dalam statistik. Misalnya, beberapa di antaranya

  • Korelasi Pearson
  • Korelasi Spearman
  • Korelasi Kendall

Korelasi linier di alam diukur dengan yang pertama, sedangkan jajaran data dibandingkan dengan dua lainnya. Ada fungsi dan metode korelasi NumPy yang berbeda untuk menghitung koefisien di atas, Matplotlib dapat digunakan untuk menampilkan hasilnya

Perhitungan Korelasi NumPy dengan Python

NumPy memiliki np. corrcoef[], yang mengembalikan matriks koefisien korelasi Pearson. Untuk ini, pertama-tama mari impor pustaka NumPy dan tentukan dua larik

import numpy as np
x=np.arange[30,40]
y=np.array[[5,3,7,6,10,14,19,35,94,58]]

Kami menggunakan np. arange[] untuk membuat larik x bilangan bulat antara 10 [inklusif] dan 20 [eksklusif]. Array y dapat dibuat dengan menggunakan metode array[] dari array nd

Sekarang sebut saja np. corrcoef[] berfungsi karena kami memiliki dua array. Argumen untuk np ini. corrcoef[] akan menjadi dua array yang telah kita buat

r=np.corrcoef[x,y]
print[r]
print[r[0,1]]
print[r[1,0]]
_

Keluaran

[[1.         0.80323888]
 [0.80323888 1.        ]]
0.8032388831482586
0.8032388831482586

Penjelasan

corrcoef[] mengembalikan matriks korelasi, yang merupakan larik dua dimensi dengan koefisien korelasi. [Memahami dimensi array NumPy di ​​Python ]

Diagonal utama matriks sama dengan 1. Nilai kiri atas adalah koefisien korelasi untuk x dan x. Demikian pula, nilai kanan bawah adalah koefisien korelasi untuk y dan y. Mereka selalu sama dengan 1

Nilai kiri bawah dan kanan atas dari matriks korelasi adalah sama dan mewakili koefisien korelasi Pearson untuk x dan y Dalam hal ini, kira-kira 0. 80

Sebagai kesimpulan, kita dapat mengatakan bahwa metode corrcoef[] dari pustaka NumPy digunakan untuk menghitung korelasi dengan Python

Satu respons untuk “Korelasi NumPy dengan Python”

  1. kata Daniel Bachrach .

    Dalam diberikan. txt file ada ribuan kata. Saya ingin dapat menghitung korelasi antara kumpulan kata. Misalnya, saya ingin dapat menghitung seberapa sering kumpulan kata [x1, x2, x3, dan x4] berkorelasi dengan kumpulan kata [y1, y2, y3, dan y4. ] Saya ingin dapat mendefinisikan set secara iteratif, sehingga saya dapat mengevaluasi korelasi antara set kata yang berbeda. Saya juga ingin membatasi batasan pada jumlah kata dalam set, sehingga panjangnya bisa berbeda. Apakah Anda kebetulan memiliki sintaks yang dapat Anda kirimkan yang dapat saya kerjakan?

    Apa yang dikembalikan NP Corrcoef?

    corrcoef mengembalikan matriks kovarian yang dinormalisasi . Matriks kovarian adalah matriks Cov[ X, X ] Cov[ X, Y ] Cov[ Y, X ] Cov[ Y, Y ]

    Bagaimana Corrcoef bekerja dengan Python?

    Koefisien Korelasi Pearson dapat dihitung dengan Python menggunakan metode corrcoef[] dari Numpy. Input untuk fungsi ini biasanya berupa matriks, misalnya berukuran mxn , di mana. Setiap kolom mewakili nilai variabel acak . Setiap baris mewakili satu sampel n variabel acak .

    Apa tujuan korelasi dalam Python?

    Korelasi merangkum kekuatan dan arah hubungan linear [garis lurus] antara dua variabel kuantitatif . Dilambangkan dengan r, dibutuhkan nilai antara -1 dan +1. Nilai positif untuk r menunjukkan asosiasi positif, dan nilai negatif untuk r menunjukkan asosiasi negatif.

    Apa yang dikatakan koefisien korelasi kepada kita?

    Koefisien korelasi adalah angka antara -1 dan 1 yang memberi tahu Anda kekuatan dan arah hubungan antar variabel . Dengan kata lain, ini mencerminkan seberapa mirip pengukuran dua variabel atau lebih di seluruh kumpulan data.

Bài mới nhất

Chủ Đề