2018-05-01から1ヶ月間の記事一覧
SQLの基本的な操作について --データベース作成-- sqlite3 データベース名 sqlite3 myfriend.sqlite3 ②--CSV インポート方法-- .separator , .import sample22.csv page1 ③--接続していたデータベースから切断-- .exit ④テーブル一覧表示 .tables ⑤スキーマ…
python 正規表現について 特殊シーケンス 説明 同義のパターン \d 任意の数字 [0-9] \D 任意の数字以外 [^0-9] \s 任意の空白文字 [\t\n\r\f\v] \S 任意の空白文字以外 [^\t\n\r\f\v] \w 任意の英数字 [a-xA-Z0-9_] \W 任意の英数字以外 [\a-xA-Z0-9_] \A 文…
pandas seleniumでスクレイピング ↓seleniumでスクレイピングして、タイトルとURLをCSVに保存する。 from selenium import webdriver browser = webdriver.Firefox() url = "http://b.hatena.ne.jp/search/text?safe=on&q=Python&users=5" browser.get(url) …
pandas 集計処理のsort,filter操作について ↓フィルタ_日カラムで20以上の行を抽出。 sample[sample["日"]>=20].head() index ID 日 時 セッション 閲覧時間 0 328667572 31 16 38 5 1 70373573 24 23 37 7 5 302325623 20 8 22 2 12 1511512688 29 21 18 6 …
csv一括読み込み ■csv一括してDataFrameにする方法 import glob import os files = glob.glob(os.path.join("フォルダ名",'*.csv')) df_list=[] for file in files: tmp_df = pd.read_csv(file,encoding='cp932',parse_dates=[""],header=1]) tmp_df['filena…
デコレータについて ■デコレータについてト デコレータは関数をラップすることで、元の関数は変更しないで前後に処理を挟んだり返す値を変更したりできます。 def デコレータ名(func): def ラップ関数名(*args, **kwargs): funcを用いたなんらかの動作 retur…
for文について ■文字列のカウント df["CommentLen"]=df["Comment"].str.len() df ■文字列のカウント # これはdf['Comment']の長さ=データ数である4が入ってしまう df['CommentLen'] = len(df['Comment']) df ■スライスの関数について 15文字までの文字列を…
高階関数について ■enumerateについて 今のループが何番目かのインデックスを扱うのに便利なenumerate関数。 enumerate関数は列挙オブジェクトを返し、forループにおいては、インデックスを利用したいループに使われます 引数にどの数字からカウントを始める…
クラスとインスタンス クラスから作られたオブジェクトのことを、インスタンスという。 ■クラス変数について クラス変数とは、クラス自体が保持する変数を指す。 クラス名の下に宣言された変数はクラス変数とみなす。 クラス変数が定義されていると、インス…