import numpy as np
import matplotlib.pyplot as plt
import scipy
from scipy import stats
from numpy.random import randn
%matplotlib inline
# import japanize_matplotlib　# Google Colabの場合


# Anacondaの場合は下記
import matplotlib
from matplotlib import font_manager
matplotlib.rc("font", family="BIZ UDGothic")


from sklearn.linear_model import LinearRegression
import itertools   # 組合わせを列挙する


res = LinearRegression()


def RSS_min(X, y, T):
    S_min = np.inf
    m = len(T)
    for j in range(m):
        q = T[j]
        res.fit(X[:, q], y)
        y_hat = res.predict(X[:, q])
        S = np.linalg.norm(y_hat-y)**2
        if S < S_min:
            S_min = S
            set_q = q
    return (S_min, set_q)


df = np.loadtxt("boston.txt", delimiter="\t")
X = df[:, [0, 2, 4, 5, 6, 7, 9, 10, 11, 12]]
p = X.shape[1]
y = df[:, 13]


n, p = X.shape
AIC_min = np.inf
for k in range(1, p+1, 1):
    T = list(itertools.combinations(range(p), k))
    # p個からk個を選ぶ組合わせを各列にもつ
    S_min, set_q = RSS_min(X, y, T)
    AIC = n*np.log(S_min/n) + 2*k     #
    if AIC < AIC_min:
        AIC_min = AIC
        set_min = set_q
print(AIC_min, set_min)


def IC(X, y, k):
    n, p = X.shape
    T = list(itertools.combinations(range(p), k))
    S, set_q = RSS_min(X, y, T)
    AIC = n*np.log(S/n) + 2*k
    BIC = n*np.log(S/n) + k*np.log(n)
    return {"AIC":AIC, "BIC":BIC}


AIC_seq = []
BIC_seq = []
for k in range(1, p+1, 1):
    AIC_seq.append(IC(X, y, k)["AIC"])
    BIC_seq.append(IC(X, y, k)["BIC"])
x_seq = np.arange(1, p+1, 1)
plt.plot(x_seq, AIC_seq, c="red", label="AIC")
plt.plot(x_seq, BIC_seq, c="blue", label="BIC")
plt.xlabel("変数の個数")
plt.ylabel("AIC/BICの値")
plt.title("変数の個数とAICとBICの値の変化")
plt.legend()

第4章情報量基準¶

46¶

48¶

第4章 情報量基準¶

46¶

48¶

第4章情報量基準¶