Uncategorized データセット一覧 統計解析

Numpyモジュールを使った乱数生成

投稿日:8月 2, 2019 更新日:

Pythonで乱数を扱うnumpyモジュールでよく利用する乱数生成方法を整理しました。

乱数の生成

用途サンプル概要
seedの設定np.random.seed(0)乱数を固定
標準正規分布np.random.randn(100)標準正規分布に従う乱数100個生成
正規分布np.random.normal(50, 10, 100)μ=50, σ=10 の正規分布に従う乱数100個生成
二項分布np.random.binomial(100, 0.5, 10000)p=0.5, n=100 の二項分布に従う乱数10000個生成
一様乱数(0-1)np.random.rand(100)0-1の一様乱数を100個生成
一様乱数(整数)np.random.randint(0, 100, 20)0-99の整数を20個生成
ポアソン分布np.random.poisson(10, 100) λ=10のポアソン分布100個生成
ベータ分布np.random.beta(3, 5, 100) a=3, b=5 のベータ分布100個生成
カイ二乗分布np.random.chisquare(2, 10)自由度2のカイ二乗分布10個生成
指数分布np.random.exponential(10,100)1/λ=10 の指数分布100個生成

ランダム抽出

用途サンプル概要
リストからのランダム抽出(重複あり)x = [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’]
y = np.random.choice(x, 5)
リストxからランダムで5つ抽出(重複あり)
リストからのランダム抽出(重複なし)x = [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’]
y = np.random.sumple(x, 5)
リストxからランダムで5つ抽出(重複なし)

-Uncategorized, データセット一覧, 統計解析

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

営業リストの作り方解説!質の良い営業リストを作るためのポイントとは

テレアポ営業をしていると「電話をかける件数に対して情報収集が間に合わない」「企業の情報を増やすために最低限の情報しか集めることができない」などの悩みにぶつかります。 テレアポ営業でも働いている会社によ …

no image

ユーザー投稿型オープンデータサイト Reddit

世界的に見ると、実に多数のデータ配布サイトが存在しています。 中でも、他のサイトと異なるユニークなサイトとして、Redditがあります。 Redditの特徴は、特に次の3点です。 特徴1:ユーザー投稿 …

no image

クリーンアップ済データの宝庫!機械学習ならQuandlがおすすめ

統計や分析、テストデータなど、研究・開発において大量のデータを必要とする場面は多々あります。そのすべての場面でデータを自己調達する必要があるとしたら、それは大変な手間です。 もちろん、過去の研究者たち …

no image

テレアポ営業に使えるアタックリスト販売サイト比較

新規の営業を行う場合、特にテレアポで営業を行う場合にはまずリスト作りが最初の仕事になるでしょう。 企業によって異なりますが、新規営業の場合はより多く電話をかけることが求められることも多いためリストは常 …

no image

python/相関行列(correlation_matrix)

多変量に対して各変数の関係性を可視化するのに役立ちます。 Contents1 データ取得2 メソッド3 相関行列の算出4 可視化 データ取得 必要なモジュールのインポート [crayon-5f08af …