python_analytics

主にpythonやライブラリーを使ったデータ解析、機械学習、統計学などについて書いていきます

2018-05-01から1ヶ月間の記事一覧

SQL の基本的な操作について

SQLの基本的な操作について --データベース作成-- sqlite3 データベース名 sqlite3 myfriend.sqlite3 ②--CSV インポート方法-- .separator , .import sample22.csv page1 ③--接続していたデータベースから切断-- .exit ④テーブル一覧表示 .tables ⑤スキーマ…

python 正規表現について

python 正規表現について 特殊シーケンス 説明 同義のパターン \d 任意の数字 [0-9] \D 任意の数字以外 [^0-9] \s 任意の空白文字 [\t\n\r\f\v] \S 任意の空白文字以外 [^\t\n\r\f\v] \w 任意の英数字 [a-xA-Z0-9_] \W 任意の英数字以外 [\a-xA-Z0-9_] \A 文…

python seleniumでスクレイピング

pandas seleniumでスクレイピング ↓seleniumでスクレイピングして、タイトルとURLをCSVに保存する。 from selenium import webdriver browser = webdriver.Firefox() url = "http://b.hatena.ne.jp/search/text?safe=on&q=Python&users=5" browser.get(url) …

python pandas sortやfilterについて

pandas 集計処理のsort,filter操作について ↓フィルタ_日カラムで20以上の行を抽出。 sample[sample["日"]>=20].head() index ID 日 時 セッション 閲覧時間 0 328667572 31 16 38 5 1 70373573 24 23 37 7 5 302325623 20 8 22 2 12 1511512688 29 21 18 6 …

pandas csv一括読み込み

csv一括読み込み ■csv一括してDataFrameにする方法 import glob import os files = glob.glob(os.path.join("フォルダ名",'*.csv')) df_list=[] for file in files: tmp_df = pd.read_csv(file,encoding='cp932',parse_dates=[""],header=1]) tmp_df['filena…

python デコレータについて

デコレータについて ■デコレータについてト デコレータは関数をラップすることで、元の関数は変更しないで前後に処理を挟んだり返す値を変更したりできます。 def デコレータ名(func): def ラップ関数名(*args, **kwargs): funcを用いたなんらかの動作 retur…

python for文について

for文について ■文字列のカウント df["CommentLen"]=df["Comment"].str.len() df ■文字列のカウント # これはdf['Comment']の長さ=データ数である4が入ってしまう df['CommentLen'] = len(df['Comment']) df ■スライスの関数について 15文字までの文字列を…

python 高階関数について

高階関数について ■enumerateについて 今のループが何番目かのインデックスを扱うのに便利なenumerate関数。 enumerate関数は列挙オブジェクトを返し、forループにおいては、インデックスを利用したいループに使われます 引数にどの数字からカウントを始める…

python クラスとインスタンスについて

クラスとインスタンス クラスから作られたオブジェクトのことを、インスタンスという。 ■クラス変数について クラス変数とは、クラス自体が保持する変数を指す。 クラス名の下に宣言された変数はクラス変数とみなす。 クラス変数が定義されていると、インス…