解答
解説
第1問
問1:(ア)正解③ (イ)正解②
(ア)正解③
<問題要旨>
日本の著作権法に関する基本的な理解を問う問題です。著作権の保護期間、私的使用のための複製、権利侵害にあたる行為など、具体的な事例を通して判断する力が求められます。
<選択肢>
①【誤】
自分が撮影した写真の著作者は自分自身です。そのため、その写真を友人に譲渡する行為は、著作者である自分の権利を侵害することにはなりません。ただし、被写体である有名人には肖像権やパブリシティ権があるため、著作者の権利とは別に、これらの権利に配慮する必要がある場合があります。
②【誤】
作曲家であるバッハは1750年に亡くなっています。日本の著作権法では、著作権の保護期間は原則として著作者の死後70年です。バッハの著作権はすでに消滅し、パブリックドメイン(社会の共有財産)となっているため、彼の曲を演奏して動画を公開しても作曲者の権利を侵害することはありません。
③【正】
自分で購入した問題集を、自分自身が勉強の目的でコピーして利用することは、著作権法で認められている「私的使用のための複製」の範囲内です。したがって、この行為は著作者の権利を侵害しません。
④【誤】
他人の著作物を、著作権者の許可なく自身のWebページに丸ごと転載する行為は、著作物を複製し、インターネットを通じて誰もがアクセスできる状態にする行為です。これは著作権のうち、複製権や公衆送信権を侵害する行為にあたります。
(イ)正解②
<問題要旨>
デジタル画像の表現形式である「ベクタ形式」と「ラスタ形式」の特徴について、その違いを正しく理解しているかを問う問題です。それぞれの形式がどのような画像の表現に適しているか、データ量の違い、拡大・縮小時の特性などを比較して判断します。
<選択肢>
①【誤】
図1のようなピクトグラムは、直線や曲線といった単純な図形で構成されています。このような画像は、図形の情報を数式で記録するベクタ形式で表現する方が、画像を色の点の集まりで記録するラスタ形式よりも、データ量を少なくできるのが一般的です。
②【正】
図2のような写真は、無数の色が複雑に変化する濃淡で構成されています。このような画像の表現には、ピクセル(画素)ごとに色情報を記録するラスタ形式が適しています。ベクタ形式は単純な図形の表現は得意ですが、写真のような複雑な画像の表現には適していません。
③【誤】
画像を拡大してもジャギー(輪郭のギザギザ)が生じないのは、図形の情報を数式で保持しているベクタ形式です。ベクタ形式は拡大・縮小の際に数式に基づいて再描画されるため、画質が劣化しません。ラスタ形式はピクセルの集まりであるため、拡大するとジャギーが目立ちます。
④【誤】
ベクタ形式のフォント(アウトラインフォント)は、文字の輪郭線を数式データとして持っているため、表示するサイズごとにフォントデータを用意する必要がありません。任意のサイズにきれいに拡大・縮小して表示することができます。表示サイズごとにデータを用意する必要があるのは、ビットマップフォント(ラスタ形式)です。
問2:(ウ)正解① (エ)正解②
<問題要旨>
ウェブ地図などで利用されるタイル画像の仕組みについて、地図のレベル(縮尺)とピクセル数、実際の距離の関係を計算し、データ量を比較する問題です。対数的なスケールで変化する地図レベルの概念を正しく理解し、計算に適用する能力が求められます。
<選択肢>
(ウ)
まず、表示したい画面解像度と地図範囲から、必要な地図の解像度を求めます。
表示範囲4.8kmを1024ピクセルで表示するので、1ピクセルあたりの距離は 4800m ÷ 1024ピクセル = 4.6875m/ピクセル です。
次に、各レベルのタイルの解像度を考えます。レベル17のタイルは、1辺300mを256ピクセルで表示するので、1ピクセルあたりの距離は 300m ÷ 256ピクセル ≒ 1.17m/ピクセル です。
地図のレベルが1つ下がる(数字が小さくなる)ごとに、タイルの1辺が表す距離は2倍になります。
・レベル17:1辺 300m
・レベル16:1辺 300m × 2 = 600m
・レベル15:1辺 600m × 2 = 1200m = 1.2km
レベル15のタイルは、1辺1.2kmを256ピクセルで表示するので、1ピクセルあたりの距離は 1200m ÷ 256ピクセル = 4.6875m/ピクセル となり、表示したい解像度と一致します。
問題文の「1辺が1.2kmにあたるレベル」はレベル15なので、ウの正解は①の15です。
(エ)
データ量をタイル画像の枚数で比較します。
・レベル15のタイルで表示する場合:
表示範囲4.8km × 2.4kmを、1辺1.2kmのタイルで敷き詰めるのに必要な枚数は、(4.8 ÷ 1.2) × (2.4 ÷ 1.2) = 4 × 2 = 8枚です。
・レベル17のタイルで表示する場合:
表示範囲4.8km × 2.4kmを、1辺300m (0.3km) のタイルで敷き詰めるのに必要な枚数は、(4.8 ÷ 0.3) × (2.4 ÷ 0.3) = 16 × 8 = 128枚です。
データ量はタイル枚数に比例するため、レベル15で表示した場合のデータ量は、レベル17で表示した場合の 8 ÷ 128 = 1/16 倍になります。
したがって、エの正解は②の1/16です。
問3:(オ)正解⓪ (カ)正解③ (キ)正解① (ク)正解④
<問題要旨>
施設の予約管理を題材に、2種類のデータ管理形式(マトリックス形式とリスト形式)の特徴を比較し、それぞれの形式におけるデータの検索や更新、削除の操作を理解する問題です。データベースの基本的な考え方に触れる内容となっています。
<選択肢>
(オ)
表1(ホワイトボード)の形式で「7月3日の武道場」を予約する場合、まず表の中から「7月3日」の行を探す必要があります。したがって、オには行を特定する条件である「<日付>が『7月3日』」が入ります。正解は⓪です。
(カ)
オで「7月3日」の行を特定した後、次にその行の中から「武道場」の列との交点にあるマスを探します。このマスが空白であれば予約が可能です。したがって、カには「その行の<武道場>のマス」が入ります。正解は③です。
(キ)
表2(コンピュータ)の形式で「7月3日」の「武道場」の予約を取り消す場合、取り消したい予約データを一意に特定する必要があります。表2は1つの予約が1行に対応しているため、「<日付>が『7月3日』」かつ「<施設>が『武道場』」という2つの条件を満たす行を探すのが適切です。したがって、キの正解は①です。
(ク)
キで予約データに対応する行を特定した後、予約を取り消すには、その予約情報全体を削除する必要があります。表2の形式では、1行が1つの予約情報に対応しているため、行そのものを削除します。したがって、クの正解は④です。
問4:(ケ)正解② (コ)正解①
<問題要旨>
ラーメンの注文システムを題材に、数値を特定の意味に割り当てることで情報を表現する方法について考察する問題です。特に、複数の選択肢を重複なく一意に識別するための数値の割り当て方(2進数の考え方)と、限られた桁数で表現できる情報の組み合わせ数を計算する力が問われます。
<選択肢>
(ケ)
トッピングは複数選択が可能であるため、選択されたトッピングの数値の合計が、他のいかなるトッピングの組み合わせ(単体も含む)の合計とも重複しないように数値を割り当てる必要があります。
① 玉子(1)+コーン(2)=3となり、のり(3)と重複するため不適です。
② 玉子(1)+コーン(2)=3、玉子(1)+のり(4)=5など、どの組み合わせを作っても合計値は重複しません。これは各数値を2のべき乗(20,21,22,23)にしているためで、2進数の各桁の重みに対応し、どのような足し算をしても結果が一意に定まります。これが適当です。
③ 玉子(1)+のり(98)=99となり、メンマ(99)と重複するため不適です。
④ 玉子(1)+コーン(2)=3となり、のり(3)と重複するため不適です。
したがって、正解は②です。
(コ)
トッピングの情報は、送られる数値の十の位と一の位、すなわち0から99までの100通りの数値で表現されます。N種類のトッピング具材を区別するには、トッピングの各組み合わせ(「なし」も含む2N通り)を、0から99までの異なる数値で表現できる必要があります。
つまり、2N通りの組み合わせを区別できる必要があるため、2Nが利用可能な数値の個数(100個)以下でなければなりません。
2N ≤ 100
この式を満たす最大の整数Nを求めます。
25 = 32
26 = 64
27 = 128
26 = 64 ≤ 100 であり、27 = 128 > 100 なので、条件を満たす最大のNは6です。
したがって、最大で6種類のトッピング具材を区別することができます。正解は①です。
第2問 A
問1:(ア)正解⑧ (イ)正解⑦
<問題要旨>
パスワードの安全性を考える上で基本となる、組み合わせの総数を計算する問題です。使える文字の種類と文字数が与えられた条件で、パスワードのパターンが何通りになるかを、累乗の考え方を用いて計算します。
<選択肢>
(ア)
パスワードに使える文字は、アルファベットの大文字26種類、小文字26種類、数字10種類の合計 26+26+10=62 種類です。パスワードの長さは10文字なので、各文字の位置に62通りの文字のいずれかを使用できます。したがって、考えられるパターン数は 62×62×⋯×62(10回)となり、6210と計算できます。これを選択肢の形式に合わせると、⑧の (10+26+26)10となります。
(イ)
ファンクラブサイトのパスワード(10文字)のパターン数は 6210通りです。一方、別のサービス(8文字)のパターン数は、同様に計算して 628通りです。ファンクラブサイトのパスワードのパターン数が、別のサービスの何倍になるかを計算するには、割り算を行います。
6210÷628=62(10-8)=622これを選択肢の形式に合わせると、⑦の (10+26+26)2となります。
問2:(ウ)正解②
<問題要旨>
個人情報を扱う会員登録の場面で、情報セキュリティの観点からとるべき行動として、適切なものはどれかを選ぶ問題です。日常生活に潜む情報漏えいのリスクを理解しているかが問われます。
<選択肢>
①【誤】
公衆無線LANは、通信が暗号化されていない場合があり、悪意のある第三者に通信内容を盗聴される危険性があります。個人情報を入力する会員登録のような場面での利用は避けるべきです。
②【正】
入力している画面を、背後や隣からのぞき見されること(ショルダーハッキング)で、IDやパスワード、個人情報が盗まれる危険があります。周囲に注意を払いながら入力することは、情報セキュリティ上、基本的かつ重要な行動です。
③【誤】
学校や図書館などに設置されている共有のパソコンは、誰が利用したかわからず、キーボードの入力履歴を盗み取るスパイウェアなどが仕掛けられている可能性も否定できません。また、入力履歴やキャッシュが残ることもあり、個人情報を入力するには不適切です。
④【誤】
ユーザIDやパスワードを紙に書いて、他人の目に触れる場所に掲示する行為は、不正ログインのリスクを著しく高めるため、絶対に行ってはいけません。パスワードは他人に知られないよう厳重に管理する必要があります。
問3:(エ)正解⓪ (オ)正解③
<問題要旨>
現代の多くのサービスで利用されている認証の仕組みについて、その種類(認証の3要素)と、複数の認証を組み合わせる多要素認証の利点を正しく理解しているかを問う問題です。
<選択肢>
(エ)
認証方法は、以下の3種類に大別されます。
・知識認証:本人だけが知っている情報(パスワード、暗証番号など)
・所有物認証:本人だけが持っている物(スマートフォン、ICカードなど)
・生体認証:本人の身体的な特徴(指紋、顔、静脈など)
「パスワード」は本人だけが知っている情報なので「知識認証」です。「認証コード」は問題文からスマートフォンに届くことがわかるため、スマートフォンという所有物を用いる「所有物認証」にあたります。したがって、正しい組み合わせは⓪です。
(オ)
パスワードと認証コードのように、複数の種類の認証方法を組み合わせることを「多要素認証」といいます。多要素認証の最大の利点は、セキュリティの強化です。仮にパスワード(知識認証)が第三者に漏えいしてしまっても、本人が所有するスマートフォン(所有物認証)がなければ認証コードを受け取れないため、不正にログインされるリスクを大幅に減らすことができます。したがって、③が最も適当です。
問4:(カ)正解②
<問題要旨>
会員証の不正利用を防ぐための対策について、いくつかの方式を比較し、複製が容易で抑制効果が期待できないものはどれかを判断する問題です。物理的な偽造の難しさや、デジタルデータの複製容易性についての知識が問われます。
<選択肢>
①【効果あり】
ICチップは内部に複雑な電子回路を持ち、情報の暗号化も可能なため、その内容を複製することは極めて困難です。不正複製を抑制する効果は非常に高い方式です。
②【効果あり】
透かしやホログラムは、専用の設備や技術がなければ再現が難しいため、紙幣などにも利用される偽造防止技術です。不正複製を抑制する効果が期待できます。
③【効果が期待できない】
PDFファイルはデジタルデータであるため、ファイル自体をコピーしたり、スクリーンショットを撮ったりすることで、誰でも簡単に複製できてしまいます。二次元コードに埋め込まれた情報もそのまま複製されるため、不正利用を抑制する効果はほとんど期待できません。
④【効果あり】
スマートフォンアプリを利用する方式では、ユーザIDとパスワードでログインしている本人しか会員証機能を使えないため、他人が不正に利用することは困難です。アプリ自体を複製することも難しく、抑制効果は高いと言えます。
問5:(キ)正解①
<問題要旨>
企業の個人情報保護の方針(プライバシーポリシー)を読み解き、そこに書かれた「利用目的」と「第三者提供」のルールに照らして、具体的な事例が問題となるかどうかを判断する問題です。文章の読解力と、個人情報保護の基本的な考え方の理解が求められます。
<選択肢>
Ⅰ:【問題とならない(○)】
「どの年齢層の会員が多いか分析する」ことは、プライバシーポリシーの利用目的「会員の属性を分析し、それに応じたサービスの改善を行うため」に合致しています。また、分析を関連会社に委託することは、利用目的の達成のために必要な「業務を委託する場合」にあたるため、問題となりません。
Ⅱ:【問題とならない(○)】
「会員にファンクラブイベントのチラシを郵送する」ことは、利用目的「イベントの運営、および、サービスに関する告知のため」や「物品や書類などの発送を行うため」に合致しています。発送業務を関連会社に委託することも、同様に「業務を委託する場合」にあたるため、問題となりません。
Ⅲ:【問題となりうる(×)】
「会員同士が互いのメールアドレスを閲覧できるシステムを提供する」ことは、会員の個人情報(メールアドレス)を、ファンクラブ運営会社以外の第三者(他の会員)に提供する行為です。これはプライバシーポリシーに記載された利用目的の範囲外であり、原則として禁止されている「第三者への提供」にあたるため、本人の明確な同意なく行うことは問題となりえます。
したがって、I:○、II:○、III:× の組み合わせである①が正解です。
第2問 B
問1:(ク)正解② (ケ)正解② (コ)正解④ (サ)正解② (シ)正解②
<問題要旨>
迷路の構造をコンピュータで扱うためのデータ表現方法について、2つの異なる方式を比較検討する問題です。それぞれの方式の仕組みを理解し、データ量を計算したり、特定の処理を行う手順を考えたりする論理的思考力が問われます。
<選択肢>
(ク)
Sさんの方法では、4ビットが順に「左・上・右・下」の壁の有無を表します。マスXの4ビット目は「下」の壁の情報です。この壁は、マスXの真下にあるマスYにとっては「上」の壁にあたります。マスYの「上」の壁の情報は、その2ビット目で表現されます。したがって、クには2が入ります。
(ケ)
Tさんの方法では、各マスは自身の「左」と「上」の壁の情報しか持っていません。そのため、あるマスから「右」に壁があるかどうかを判断するには、そのマスの「右隣のマス」が持つ「左」の壁の情報を調べる必要があります。右隣のマスの「左の壁」の情報は、そのマスの左端から1ビット目で表されるため、②が正解です。
(コ)
Sさんの方法では、1つのマスを表現するのに4ビットが必要です。迷路はN×Nマスでできているので、マスは全部でN2個あります。したがって、迷路全体を表すのに必要なデータ量は 4×N2=4N2ビットとなります。正解は④です。
(サ)
Tさんの方法では、1マスあたり2ビットですが、「右と下に一列ずつ余分に」マスを用意するため、(N+1)×(N+1)個のマスで管理すると考えられます。必要なデータ量は 2×(N+1)2=2×(N2+2N+1)=2N2+4N+2 ビットです。選択肢の中で、Nが大きくなるにつれてこの値に最も近くなるのは②の 2N2+4N です。
(シ)
Tさんの方法が必要なデータ量の方がSさんの方法より少なくなる条件は、(サのデータ量) < (コのデータ量) という不等式で表せます。
2N2 + 4N < 4N2
この不等式を整理すると、
0 < 2N2 − 4N
0 < 2N(N−2)
Nは迷路の大きさなので N>0 です。したがって、両辺を 2N で割ることができ、0<N−2、すなわち N>2 となります。したがって、シには2が入ります。
問2:(ス)正解① (セ)正解③ (ソ)正解⑥
<問題要旨>
迷路のゲームにおいて、コンピュータが操作するキャラクターをゴール(財宝)まで導くためのアルゴリズムを考える問題です。ゴールから逆算して各マスにゴールへ向かう方向を設定していく手順を、会話文から正しく読み解く必要があります。
<選択肢>
(ス、セ)
このアルゴリズムは、財宝のマスから始めて、隣接するマスに次々と「財宝はこちら」という方向の矢印を書き込んでいくものです。あるマスMに矢印が書き込まれたら、次は「Mに壁なく隣接していて、まだ矢印が書かれていないマスP」を探し、Pに「Mへ向かう矢印」を書き込みます。
問題文の状況では、「0011」というデータを持つマス(上と左に壁がない)に「←」という矢印が書き込まれたところです。このマスには上方向から進入できるため、次に行う処理は、このマスの「上(ス)」側のマスに、このマスを指し示す矢印である「↓(セ)」を書き込むことになります。したがって、スは①、セは③です。
(ソ)
完成した図5(すべてのマスが「あ」を向いている状態)を、すべてのマスが「う」を向くように書き換えるには、「う」から「あ」までの最短経路上のマスにある矢印の向きをすべて逆向きにし、「う」を新たな財宝(○)に、「あ」を矢印にする必要があります。
図4および図5から、「う」から「あ」への経路は、「う」→上→左→上→左→上→「あ」とたどる6個のマスで構成されています。したがって、この6個すべてのマスの情報を書き換える必要があります。よって、ソには6が入ります。
第3問
問1:(ア)正解⑤ (イ)正解⑧
<問題要旨>
ごみ拾いの結果を記録するプログラムにおいて、入力されたデータを対応する配列の正しい位置に格納するための処理を考える、基本的なプログラミングの問題です。変数と配列の添字の関係を正しく理解することがポイントです。
<選択肢>
(ア)
プログラムの(05)行目で「ごみの種類は?」と表示した後に、数値を入力させています。ごみの種類のデータは配列Shuruiに格納するルールです。また、(02)行目で入力した出席番号が変数nに代入されているため、Shurui配列のn番目の要素に格納するのが適切です。したがって、アには⑤のShurui[n]が入ります。
(イ)
プログラムの(07)行目で「計量結果(g)は?」と表示した後に、数値を入力させています。計量結果のデータは配列Keiryouに格納するルールです。これも同様に、変数nで指定された生徒のデータとして、Keiryou配列のn番目の要素に格納します。したがって、イには⑧のKeiryou[n]が入ります。
問2:(ウ)正解④ (エ)正解⓪ (オ)正解③ (カ)正解⑤ (キ)正解⑥
<問題要旨>
配列に格納された全生徒のデータを使って、繰り返し処理(ループ)と条件分岐(if文)を用いて、ごみの種類ごとに総重量を集計するプログラムの穴埋め問題です。プログラミングにおける集計処理の基本的な流れを理解しているかが問われます。
<選択肢>
(ウ)
(03)行目からの繰り返し処理は、クラスの生徒全員分のデータを1人ずつ処理するためのものです。生徒の人数は(01)行目で変数ninzuに40として代入されているため、繰り返しは1からninzuまで行うのが適切です。したがって、ウには④のninzuが入ります。
(エ)
(04)行目の条件分岐は、(05)行目の処理gomi = Keiryou[i] – 350を行うかどうかを判断しています。350gはバケツの重量なので、この処理は「入れ物がバケツの場合」に行います。入れ物がバケツであることは、配列Iremonoの値が1であることで表されるため、条件式は⓪のIremono[i] == 1となります。
(オ)
(08)行目の条件分岐は、(09)行目で可燃ごみの総重量kanenに加算する処理を行っていることから、「ごみの種類が可燃ごみの場合」を判断しているとわかります。ごみの種類が可燃ごみであることは、配列Shuruiの値が1であることで表されるため、条件式は③のShurui[i] == 1となります。
(カ)
(09)行目は、可燃ごみの総重量を累積で加算していく処理です。それまでの合計値が格納されている変数kanenに、今回計算したごみの重量gomiを加えるため、カには⑤のkanenが入ります。
(キ)
(11)行目は、(08)行目の条件(可燃ごみ)に当てはまらなかった場合、すなわち不燃ごみの場合の処理です。不燃ごみの総重量を累積で加算していくため、それまでの合計値funenにgomiを加えます。したがって、キには⑥のfunenが入ります。
問3:(ク)正解① (ケ)正解⓪ (コ)正解④ (サ)正解c (シ)正解⑧ (ス)正解b
<問題要旨>
ごみの種類が増えたことに伴うプログラムの変更についての問題です。文字列で入力されたごみの名称を、対応する種類番号に変換する処理や、集計用の配列を使って7種類のごみの総重量をそれぞれ計算し、表示する処理の流れを正しく組み立てる力が問われます。
<選択肢>
(ク、ケ)
図5のプログラムは、入力されたごみの名称(文字列)が、配列Namaeの何番目にあるかを調べて、その番号を取得する処理です。(05)行目の繰り返し処理は、配列Namaeの全要素を調べる必要があるので、ごみの種類数であるshuruisuの回数だけ繰り返します(ク=①)。(06)行目で名称が一致した場合、その時の配列の添字jが種類番号に対応するので、(07)行目では種類番号を格納するShurui[n]にjを代入します(ケ=⓪)。
(コ)
図6のプログラムの(10)行目では、生徒iが集めたごみの種類に応じて、集計用配列Goukeiの正しい位置に重量を加算するための準備をしています。生徒iのごみの種類番号はShurui[i]に格納されているため、これを集計用配列の添字として使う変数sに代入します。したがって、コには④のShurui[i]が入ります。
(サ)
(11)行目は、種類sのごみの総重量を累積加算する処理です。それまでの種類sの合計重量が格納されているGoukei[s]に、今回のごみの重量gomiを加えます。したがって、サにはⓒのGoukei[s]が入ります。
(シ)
(13)行目は、集計結果を表示する部分です。(12)行目からの繰り返し処理の変数jが種類番号を表しているので、jに対応するごみの名称を表示します。名称は配列Namaeに格納されているため、シには⑧のNamae[j]が入ります。
(ス)
(13)行目で、ごみの名称に続けて総重量を表示します。種類番号jに対応する総重量は、集計用配列Goukeiのj番目の要素に格納されています。したがって、スにはⓑのGoukei[j]が入ります。
第4問
問1:(ア)正解① (イ)正解②
<問題要旨>
統計の基本的な指標である「相関係数」の性質を正しく理解しているか、また、提示された相関係数行列からどのような傾向が読み取れるかを判断する問題です。
<選択肢>
(ア)
相関係数は、2つの変数の間の直線的な関係の強さと向きを示す指標で、-1から1までの値をとります。その絶対値が1に近いほど、散布図にプロットした点の集まりは直線に近くなります。正の値は「片方が増加するともう片方も増加する」傾向(正の相関)を、負の値は「片方が増加するともう片方は減少する」傾向(負の相関)を示します。したがって、相関係数の性質を正しく説明しているのは①です。
(イ)
表2を見ると、どの項目の組み合わせでも、相関係数が0.95以上という非常に高い正の値になっています。これは、いずれの項目間にも非常に強い正の相関があることを意味します。特に「病院数」と各年齢層の人口との相関係数もすべて高い値であることから、「年齢層に関わらず、人口が多い都道府県ほど病院の数も多い傾向にある」と読み取ることができます。したがって、②が正解です。
問2:(ウ)正解⓪ (エ)正解②
<問題要旨>
統計データを分析するために新たに作成した指標(「病院/人口」「病院/面積」)がそれぞれどのような意味を持つかを考察し、散布図行列から読み取れる複数の指標間の相関関係を正しく解釈する問題です。
<選択肢>
(ウ)
「病院/人口」が人口に対する医療サービスの供給量を測る指標であるのに対し、「病院/面積」は単位面積あたりにどれだけの病院が存在するかを示す指標です。これは、病院が地理的に密集しているのか、まばらに点在しているのか、すなわち「分布の疎密の程度」を表す指標と考えることができます。したがって、⓪が最も適当です。
(エ)
図1の散布図行列から、各指標間の相関係数を読み取ります。
・「65歳以上割合」と「病院/人口」の相関係数は0.37(正の相関)。
・「65歳以上割合」と「病院/面積」の相関係数は-0.59(負の相関)。
このことから、『「65歳以上割合」が大きい都道府県(高齢化が進んでいる都道府県)では、人口あたりの病院数はA「多く」なる傾向があり、面積あたりの病院数はB「少なく」なる傾向がある』と解釈できます。この組み合わせに合致する選択肢は②です。
問3:(オ)正解③
<問題要旨>
複数の指標間の相関関係(見せかけの相関など)をより深く理解するために、新たな指標「人口密度」を導入し、そこから導かれる仮説を組み立てる問題です。データ間の関係性を多角的に捉え、論理的に考察する力が求められます。
<選択-肢>
まず、仮説の前半「C が進むと、高齢化が進む」について考えます。図2の散布図行列から「人口密度」と「65歳以上割合(高齢化の指標)」の相関係数を見ると-0.65です。これは負の相関であり、「人口密度が低い」ほど「65歳以上割合が高い」傾向を示します。人口密度が低い状態とは「過疎化」なので、Cには「過疎化」が入ります。
次に、仮説の後半「C(過疎化)が進むと、面積あたりの病院数が D なる」について考えます。「人口密度」と「病院/面積」の相関係数は0.99と非常に強い正の相関です。これは、「人口密度が低い(過疎化が進んでいる)」ほど「病院/面積も低い(少なくなる)」傾向を示します。したがって、Dには「少なく」が入ります。
以上から、Cに「過疎化」、Dに「少なく」が入る③が正しい仮説となります。
問4:(カ)正解② (キ)正解③ (ク)正解①
<問題要旨>
ヒストグラムの形状からデータの分布の特徴を読み取ったり、データを特定の基準でグループ分けした上で散布図を比較し、各グループの傾向や違いを考察したりする問題です。データ可視化の基本的な手法を理解し、図から情報を正確に読み取る能力が問われます。
<選択肢>
(カ)
図2の左上にある「人口密度」のヒストグラムを見ると、データの度数が最も左側の階級(人口密度が低い)に著しく集中しており、右側(人口密度が高い)になるにつれて急激に減少する、左右非対称な分布をしています。このような分布の特徴を正しく表現しているのは②「左側の階級に度数が集中している」です。
(キ)
図3の散布図でXグループ(人口密度が低い=過疎)と○グループ(人口密度が高い=過密)を比較します。
・「病院/面積」(縦軸)に注目すると、Xグループの点はほとんどが0~1の非常に狭い範囲に集中しています。
・一方、○グループの点は0から10を超える値まで、非常に広範囲に散らばっています。
データの散らばり具合を表す「分散」は、明らかに○グループの方が大きいと言えます。したがって、③が正解です。
(ク)
図3の散布図で、Xグループのプロット(×印)に注目します。すべての×印は、縦軸の1.0の線よりも下にプロットされています。これは、Xグループに属するすべての都道府県において、面積1km²あたりの病院数が1施設未満であることを示しています。したがって、①がXグループの特徴を正しく説明しています。
問5:(ケ)正解②
<問題要旨>
統計的な手法の一つである単回帰分析の結果(回帰直線の方程式)を用いて、ある説明変数(人口密度)の値から目的変数(病院/面積)の値を予測する、基本的な計算問題です。
<選択肢>
与えられた回帰直線の方程式は、
(「病院/面積」の予測値) = 9.70 × 「人口密度」 – 0.08
です。
この式の「人口密度」に、問題で与えられた値である0.3を代入して計算します。
予測値 = 9.70 × 0.3 – 0.08
= 2.91 – 0.08
= 2.83
したがって、予測値は1km²あたり2.83施設となります。正解は②です。