python_analytics

主にpythonやライブラリーを使ったデータ解析、機械学習、統計学などについて書いていきます

2018-04-01から1ヶ月間の記事一覧

python lambdaについて

pythonのlambdaについて ■lambdaについて import numpy as np import pandas as pd index ID 日 時 セッション 閲覧時間 0 328667572 31 16 38 5 1 70373573 24 23 37 7 2 1839656582 12 20 28 6 4 1471882803 10 22 22 7 5 302325623 20 8 22 2 ↓日と時の文…

python pandas 集計処理(group by関数)

pandas 集計処理(groupby関数)について ■集約処理について 同じ集約単位に対する複数の処理を行う場合には、groupby関数関数を利用することで 同時に集約処理が可能だが、集約処理が1つの場合は、agg関数を使わない方が簡潔に書ける。 import numpy as np im…

python pandas 初歩的な操作

pandas 集計処理の基本的な操作について ■時系列の変換について カテゴリ型は、数値型に次いでよく使う型。pythonではastype関数はデータ型を変換する関数。 import numpy as np import pandas as pd index ID 日 時 セッション 閲覧時間 0 328667572 31 16 …

python pandas 集計処理(時系列)

pandas 集計処理(時系列の関数)について ■時系列の変換について カテゴリ型は、数値型に次いでよく使う型。pythonではastype関数はデータ型を変換する関数。 import numpy as np import pandas as pd ID time セッション 328667572 20180331 38 70373573 201…

python pandas 集計処理(ダミー変数)

pandas 集計処理(get_dummies関数)について ■astype関数とcategory変換について カテゴリ型は、数値型に次いでよく使う型。pythonではastype関数はデータ型を変換する関数。 import numpy as np import pandas as pd index ID 日 時 セッション 閲覧時間 0 3…

python pandas 集計処理(pivot_table関数)

pandas 集計処理(pivot_table関数)について ■pivot_table処理について 集約処理と横軸変換が同時にできる。 ■pivot_tableでやること① 1つ目の引数に対象テーブル、index引数にデータの集合を表すキー値、columns引数にデータ要素の 種類を表すキー値、values…

python pandas 集計処理(rank関数)

pandas 集計処理(rank関数)について ■rank処理について rank関数は文字列には対応していない。method引数によって、同じ値のデータが複数存在したときに 順位の決定方法を指定できる。ascending引数によって、並び方の昇順/降順が指定可能。 import numpy a…

python pandas 集計処理(agg関数)

pandas 集計処理について ■集約処理について DataFrameからgroupby関数を呼び出し、引数に集約単位を設定し さらに集約関数を呼び出すことで可能。 データ数を算出する集約関数は、size関数。ユニークカウントする関数は nunique関数。 同じ集約単位に対する…

pythonのnumpyについて

numpyの配列について ここは、numpy配列についての備忘録 import numpy as np import pandas as pd ■1次元の配列について flattenとravelは配列をフラットな1次配列にする関数。 a = np.arange(12).reshape(3,4) a.ravel() →array([ 0, 1, 2, 3, 4, 5, 6, 7,…

pythonのpandasについて

pandasについて ここは、pandasについての備忘録 pandasはデータの持ち方としてDataFrameとSeriesがある。Dataframeは複数のSeriesで構成されている。 行はindexで管理され、インデックスには0から始まる番号やラベルがつけられている。 import numpy as np …