• Contact Us

    Telp/WA: 08571 5200 869

    email: bengkeldatacom@gmail.com

  • My FB

    http://facebook.bengkeldata.com Jasa Analisis Data Statistik

    Buat Lencana Anda
  • Fans Page

  • TwitTwit

  • Instagram : bengkeldata

    Tidak ada gambar Instagram yang ditemukan.

  • TOP Search

    • Tidak ada
  • free counters

Pemrograman Python dalam Fundamental Statistika

Python adalah salah satu bahasa pemrograman yang populer digunakan dalam analisis statistik dan ilmu data. Berikut adalah beberapa jenis coding Python yang sering digunakan dalam konteks statistik, beserta contoh penggunaannya:

  1. Menggunakan library NumPy untuk operasi numerik: NumPy adalah library Python yang sangat populer untuk komputasi numerik. Ini menyediakan struktur data seperti array dan matriks multidimensi yang efisien dan berbagai fungsi matematika untuk memanipulasi data numerik.

Contoh: Menghitung rata-rata dari sebuah dataset.

import numpy as np

data = [10, 20, 30, 40, 50]

rata_rata = np.mean(data)

print(rata_rata)

contoh lain yaitu:

import numpy as np

# Membuat array dari data

data = np.array([2, 4, 6, 8, 10])

# Menghitung rata-rata dari data

mean = np.mean(data)

# Menghitung standar deviasi dari data

std_dev = np.std(data)

# Menghitung median dari data

median = np.median(data)

print(“Mean:”, mean)

print(“Standard Deviation:”, std_dev)

print(“Median:”, median)

  1. Menggunakan library Pandas untuk manipulasi data: Pandas adalah library Python yang kuat untuk manipulasi dan analisis data. Ini menyediakan struktur data seperti DataFrame yang memudahkan untuk mengimpor, memanipulasi, dan menganalisis data tabular.

Contoh: Membuat DataFrame dan menerapkan fungsi statistik dasar.

import pandas as pd

data = { 'nama': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'], 'usia': [25, 30, 35, 40, 45], 'gaji': [50000, 60000, 75000, 80000, 70000] }

df = pd.DataFrame(data)

rata_rata_usia = df['usia'].mean()

rata_rata_gaji = df['gaji'].mean()

print("Rata-rata usia:", rata_rata_usia)

print("Rata-rata gaji:", rata_rata_gaji)

contoh lain yaitu:

import pandas as pd

# Membuat DataFrame dari data

data = { ‘Nama’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Eva’], ‘Usia’: [25, 30, 35, 40, 45], ‘Gaji’: [5000, 6000, 8000, 5500, 7000] }

df = pd.DataFrame(data)

# Menampilkan beberapa data pertama dalam DataFrame

print(df.head())

# Menghitung rata-rata gaji

mean_gaji = df[‘Gaji’].mean()

# Menghitung nilai maksimum usia

max_usia = df[‘Usia’].max()

print(“Mean Gaji:”, mean_gaji)

print(“Maksimum Usia:”, max_usia)

  1. Menggunakan library Matplotlib untuk visualisasi data: Matplotlib adalah library grafik yang populer di Python yang memungkinkan pengguna untuk membuat berbagai jenis grafik dan plot.

Contoh: Membuat plot histogram dari data.

import matplotlib.pyplot as plt

data = [10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60]

plt.hist(data, bins=5, edgecolor='black')

plt.xlabel('Nilai')

plt.ylabel('Frekuensi')

plt.title('Histogram Data')

plt.show()

  1. Menggunakan library SciPy untuk analisis statistik lebih lanjut: SciPy adalah library Python yang membangun di atas NumPy dan menyediakan berbagai fungsi untuk analisis statistik, optimisasi, aljabar linear, dan banyak lagi.

Contoh: Menghitung korelasi antara dua set data.

import numpy as np

from scipy.stats import pearsonr

data1 = np.array([1, 2, 3, 4, 5])

data2 = np.array([5, 4, 3, 2, 1])

correlation, p_value = pearsonr(data1, data2)

print("Korelasi antara data1 dan data2:", correlation)

print("Nilai p:", p_value)

contoh lain yaitu:

import scipy.stats as stats

# Contoh data distribusi normal

data = [2, 4, 6, 8, 10]

# Menghitung uji t dan p-value untuk data

t_statistic, p_value = stats.ttest_1samp(data, 5)

print(“T-Statistic:”, t_statistic)

print(“P-Value:”, p_value)

Berikut adalah beberapa jenis coding Python dalam statistik beserta contohnya, serta referensi buku, jurnal, dan artikel tentang Python untuk referensi lebih lanjut:

  1. Jenis Coding: Regresi Linear dengan pustaka scikit-learn Contoh:

from sklearn.linear_model import LinearRegression

# Data training

X_train = [[1], [2], [3], [4], [5]]

y_train = [2, 4, 5, 4, 5]

# Membuat model regresi linear

model = LinearRegression()

# Melatih model dengan data training

model.fit(X_train, y_train)

# Memprediksi nilai untuk data baru

X_new = [[6]]

y_pred = model.predict(X_new)

print(“Prediksi:”, y_pred)

Referensi:

  • Buku: “Python Machine Learning” oleh Sebastian Raschka dan Vahid Mirjalili, penerbit: Packt Publishing, tahun terbit: 2017.
  1. Jenis Coding: Uji Hipotesis dengan pustaka SciPy

Contoh:

import scipy.stats as stats

# Contoh data distribusi dua kelompok

group1 = [65, 72, 78, 68, 71]

group2 = [60, 65, 73, 70, 68]

# Uji t-test independen

t_statistic, p_value = stats.ttest_ind(group1, group2)

print("T-Statistic:", t_statistic)

print("P-Value:", p_value)

Referensi:

  • Artikel: “Student’s t-test” oleh William Sealy Gosset, jurnal: Biometrika, tahun terbit: 1908.
  1. Jenis Coding: Analisis Data dengan Pandas dan Visualisasi dengan Matplotlib

Contoh:

import pandas as pd

import matplotlib.pyplot as plt

# Data contoh

data = { 'Bulan': ['Jan', 'Feb', 'Mar', 'Apr', 'Mei'], 'Penjualan': [100, 120, 90, 110, 130] }

# Membuat DataFrame

df = pd.DataFrame(data)

# Plot data penjualan

plt.plot(df['Bulan'], df['Penjualan'], marker='o')

plt.xlabel('Bulan')

plt.ylabel('Penjualan')

plt.title('Grafik Penjualan per Bulan')

plt.show()

Referensi:

  • Buku: “Python for Data Analysis” oleh Wes McKinney, penerbit: O’Reilly Media, tahun terbit: 2017.
  1. Jenis Coding: Pengolahan Data dengan NumPy

contoh:

import numpy as np

# Membuat array dari data

data = np.array([1, 2, 3, 4, 5])

# Menghitung rata-rata

mean = np.mean(data)

print("Rata-rata:", mean)

Referensi:

  • Artikel: “NumPy: A Guide to NumPy” oleh Travis Olliphant, tahun terbit: 2006.
  1. Jenis Coding: Analisis Statistik Lanjutan dengan SciPy

contoh:

import scipy.stats as stats

# Contoh data distribusi normal

data = [2, 4, 6, 8, 10]

# Menghitung uji t dan p-value untuk data

t_statistic, p_value = stats.ttest_1samp(data, 5)

print("T-Statistic:", t_statistic)

print("P-Value:", p_value)

Referensi:

  • Jurnal: “The Scientific Python Ecosystem” oleh Pauli Virtanen, et al., jurnal: Nature Methods, tahun terbit: 2020.

Dengan menggunakan berbagai library Python yang kuat ini, analisis statistik dan ilmu data menjadi lebih mudah dan efisien. Tentu saja, ada banyak jenis coding lain yang relevan dengan statistik dalam Python, tetapi contoh-contoh di atas dapat memberi gambaran tentang bagaimana Python digunakan dalam analisis statistik.