python_analytics

主にpythonやライブラリーを使ったデータ解析、機械学習、統計学などについて書いていきます

2018-04-21から1日間の記事一覧

python pandas 集計処理(rank関数)

pandas 集計処理(rank関数)について ■rank処理について rank関数は文字列には対応していない。method引数によって、同じ値のデータが複数存在したときに 順位の決定方法を指定できる。ascending引数によって、並び方の昇順/降順が指定可能。 import numpy a…

python pandas 集計処理(agg関数)

pandas 集計処理について ■集約処理について DataFrameからgroupby関数を呼び出し、引数に集約単位を設定し さらに集約関数を呼び出すことで可能。 データ数を算出する集約関数は、size関数。ユニークカウントする関数は nunique関数。 同じ集約単位に対する…

pythonのnumpyについて

numpyの配列について ここは、numpy配列についての備忘録 import numpy as np import pandas as pd ■1次元の配列について flattenとravelは配列をフラットな1次配列にする関数。 a = np.arange(12).reshape(3,4) a.ravel() →array([ 0, 1, 2, 3, 4, 5, 6, 7,…

pythonのpandasについて

pandasについて ここは、pandasについての備忘録 pandasはデータの持ち方としてDataFrameとSeriesがある。Dataframeは複数のSeriesで構成されている。 行はindexで管理され、インデックスには0から始まる番号やラベルがつけられている。 import numpy as np …