- 전체
- Sample DB
- database modeling
- [표준 SQL] Standard SQL
- G-SQL
- 10-Min
- ORACLE
- MS SQLserver
- MySQL
- SQLite
- postgreSQL
- 데이터아키텍처전문가 - 국가공인자격
- 데이터 분석 전문가 [ADP]
- [국가공인] SQL 개발자/전문가
- NoSQL
- hadoop
- hadoop eco system
- big data (빅데이터)
- stat(통계) R 언어
- XML DB & XQuery
- spark
- DataBase Tool
- 데이터분석 & 데이터사이언스
- Engineer Quality Management
- [기계학습] machine learning
- 데이터 수집 및 전처리
- 국가기술자격 빅데이터분석기사
- 암호화폐 (비트코인, cryptocurrency, bitcoin)
데이터 분석 전문가 [ADP] [ADsP] 제12회 데이터분석준전문가 시험 복원
2017.11.23 21:55
[ADsP] 제12회 데이터분석준전문가 시험 복원
http://blog.naver.com/dhyeom92/220985454507 12회+ADsP+기출문제+복원_최종.docx
한동안 바빠서 블로그를 못했는데.. 그동안 미루고 미뤄놨던 12회 ADsP 시험 복원 문제를 올려보겠다.
시험 본 날 저녁에 바로 복원했고, 까먹은 부분은 데이터베이스 전문가 포럼 카페를 참고하기도 했다.
그리고 같이 스터디 한 분들의 도움을 받기도 했다.
그래도 잊어버린 곳이 많아서 물음표가 많다 ㅎㅎ
그냥 이런 형식으로 문제가 나오는 구나~정도만 확인하면 될 것 같다.
12회 시험은 유난히도 기초 통계 부분이나 R 해석 문제가 많이 나왔다.
R화면 캡쳐해서 해석해라 하는 형식의 문제는 모두 기억할 수 없으므로 거의 물음표로 해놨다. ㅋㅋ
<1과목>
1. 빅데이터는 여러 사람들이 쓸 수 있는 공용의 데이터다 라는 특징을 비유한 말로 적절한 것은?
① 산업혁명의 석탄과 철
② 21세기의 원유
③ 렌즈
④ 플랫폼
2. 빅데이터의 등장으로 표본선택 시 문제가 되었던 사항들이 해결될 수 있게 됐다. 이를 통해 알 수 있는 빅데이터가 만드는 변화에 대한 설명으로 옳은 것은?
① 데이터의 사후처리가 중요해졌다
② 전수조사로의 변화
③ 인과관계 분석으로 변화했다
④ 상관관계 분석으로 변화했다
3. 빅데이터 시대의 위기요인으로 책임원칙훼손이 꼽힌다. 이에 대한 예로 바른 것은?
① 범죄를 저지르기 전에 체포하는 것
② 구글의 검색 결과 후 80%확률로 사용자가 무슨 행동을 할 지 예측하는 것
③ 검색 결과에서 특정 회사가 누락될 수 있다.
④ SNS보고 빈집에서 절도하는 것
4. 다음 사례와 데이터 분석 방법이 옳게 짝지어지지 않은 것은?
가) 고객 만족도가 충성도에 미치는 영향을 분석하는 것
나) 사람들의 인맥?인간관계가 승진에 미치는 영향을 분석하기 위해 소셜네트워크 분석을 함
다) 비슷한 비행기의 고장 수리에 대한 분석들로 비행기 수리 시간을 예측하는 것
라) 택배 경로를 최적화 하기 위해 ??? 분석을 함
① (가) – 회귀분석
② (나) – 소셜분석
③ (다) – 예측분석
④ (라) – 유형분석
5 비즈니스 관점에서 채널은 ~~~의 역할을 한다. 다음 중 채널의 예가 아닌 것은?
① 고객에게 제품을 전달함??
② 고객에게 제품 프로모션을 제공한다.
③ 제품 AS에 관한 예
④ 제품에 대한 고객의 이해를 높인다
6. 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 처리해주고 데이터베이스를 관리해주는 소프트웨어
① Sql
② Dbms
③ ????
④ ????
7. 빅데이터의 가치판단이 어려운 이유로 바르지 않은 것은?
① 데이터를 누가 언제 재사용하는지 알 수 없다.
② 기존에 분석할 수 없던 것을 분석할 수 있게 되었다.
③ 어떻게 매쉬업을 하느냐에 따라 ???이 달라진다??
④ 빅데이터 관련 전문인력이 많아져서 가치가 올라갔다
8. 과거 CRM에 대한 설명으로 바르지 않은 것은??
① ????
② ????
③ ????
④ CRM은 기업 내부 고객들의 정보만을 수집하여 활용하는 방안이다??
9. 기가바이트 -> 테러바이트 -> ( ) 바이트 -> 엑사바이트
페타바이트
10. 사물인터넷으로 공장을 가동시켜 정보를 축적해 생산의 효율을 올리는 것
스마트 팩토리
<2과목>
1. 분석의 방법은 알고 있으나 분석의 대상을 모를 때 분석 과제 도출의 유형은?
① 최적화
② 솔루션
③ 통찰
④ 발견
2. CRISP-DM 분석방법론에서 모델링 단계에 속하는 태스크가 아닌 것은?
① 모델링 과정 평가
② 모델링 기법 선택
③ 모델 적합성 평가
④ 모델 평가
3. 데이터 분석 순서에 대한 설명으로 바르지 않은 것은?
① ????
② 분석하고자 도출한 과제를 pool에 저장한다
③ 분석 후 나온 정보, 지식 등을 pool에 저장하여 관리한다
④ ????
4. ROI 관점에서 빅데이터의 핵심 특징 중 투자비용 요소가 아닌 것은?
① 크기
② 다양성
③ 속도
④ 가치
5. 빅데이터 분석 기획 시 고려할 사항으로 바르지 않은 것은?
① 기획자의 창의성 발휘를 막지 않기 위해서 기획 할 때 자세하게 하면 안된다??
② 데이터 분석은 창의적인 업무여서 기간에 제약을 두어선 안된다??
③ ????
④ ????
6. 데이터 형식에 따른 특성 설명으로 바르지 않은 것은?
① 비정형데이터는 메타데이터를 내부에 포함하고 있고 파일형식으로 저장된다
② ????
③ ????
④ ????
7. 데이터 위주의 의사소통이 이루어지지 않는 이유들로 묶인 것은?
① 프레이밍 효과, 직관성
② 고정관념, 비판성
③ bias, 프레이밍 효과
④ 직관성, 비편향성
8. 분석준비도 문제??
① 최적화
② 해당 분석기법 파악
③ ????
④ ????
9. 비즈니스 모델 기반 문제 탐색에서 비즈니스 모델 캔버스를 9가지 블록인 ( ), ( ), 고객, 규제와 감사, ( ) 으로 단순화 시킨다. 빈칸에 들어갈 단어를 순서대로 쓰시오
업무, 제품, 지원 인프라
10. 데이터 거버넌스 수립 시, 데이터 표준화, 데이터 관리 체계, 데이터 저장소 관리, 표준화 활동으로 이루어진다. 여기서 ( )를 하지 않으면 데이터 가용성 및 관리비용 증대 문제에 직면하게 될 수 있다
데이터 생명 주기 관리 방안
<3과목>
1. 인공신경망 분석에서 뉴런의 활성화 함수 중 사후 확률이 두 개 이상 나오는 함수는?
① 시그모이드 함수
② 부호 함수
③ Tahn 함수
④ 소프트 맥스
2. 텍스트 마이닝 절차 중 텍스트이 정제, 통합, 선택, 변환의 과정을 거친 구조화된 단계로서 더 이상 추가적인 절차 없이 텍스트 마이닝 알고리즘 실험에서 활용될 수 있는 상태
① Corpus
② Data Dictionary
③ ????
④ TDM
3. 텍스트 마이닝에서 문장에서 사용된 긍정과 부정여부에 따라 긍정문장인지 부정문장인지 파악하는 것
① 감성분석
② 워드클라우드
③ 토픽분석? 이슈분석?
④ ????
4. 연관분석의 사례가 맞는 것 두가지는?
① ????
② ????
③ ????
④ ????
5. 은닉층과 은닉노드에 대한 문제
① 은닉노드가 많으면 일반화가 가능하다
② 은닉노드가 적으면 과소적합??
③ 입력의 수는 입력차원의 수로 결정한다
④ ????
6. 앙상블 기법에 대한 설명 중 옳지 않은 것은?
① 배깅에 대한 설명
② 부스팅에 대한 설명
③ 랜덤 포레스트에 대한 설명
④ ????
7. 데이터 마이닝 단계 순서를 알맞게 배열한 것은?
가) 목적설정
나) 데이터 준비
다) 데이터 가공
라) 기법 적용
마) 검증
8. 주성분분석의 목적 중 틀린 것은?
① 주성분분석으로 묶는 변수들은 연관없이 묶는 거다??
② 다중공선성이 존재할 때 해결방안으로 사용한다
③ 주성분분석으로 차원을 축소한 후에 군집분석을 수행하면 속도가 빨라진다
④ 주성분분석으로 차원을 축소하고 시계열분포를 분석하면 기계의 고장 징후를 사전에 파악할 수 있다
9. 회귀분석 가정에 대한 문제 (그래프를 보고 무엇을 의미하는지 파악하기)
① 독립성
② 등분산성
③ 비상관성
④ 정상성
10. 상자그림 그래프 보고 해석하는 문제 (chicken 표 문제)
① ???의 평균이 가장 크다?
② ???변수의 50%는 150 이하이다
③ 표본의 개수는 25개이다??
④ 이상값이 없다
11. 치킨 표 보고 데이터 테이블로 변환한 R 해석하는 문제
① ????
② ????
③ ????
④ ????
12. R 함수 계산하는 문제
fb<-function(a){
x=1
for(x in 1:a){
x= x*a
}
fn(4)
① 24
② 12
③ 8
④ 6
13. 구간척도 설명을 보고 무슨 척도인지 고르는 문제
① ????
② ????
③ ????
④ ????
14. 미국 대학 777개의 표본에 대한 회귀분석 결과를 보고 해석하는 문제
① 책의 평균값은 570 이다
② 가설을 기각할 수 없다
③ ????
④ ????
15. 데이터 테이블로 변환한 표를 보고 데이터 테이블 내에서 sum함수 사용법을 묻는 문제
① ????
② ????
③ ????
④ ????
16. 연속형 확률분포가 아닌 것은?
① 이항분포
② 정규분포
③ 지수분포
④ t분포
17. 비모수 검정에 대한 설명 중 바르지 않은 것은?
① 표본의 크기가 작을 때, 특정분포를 따른다고 가정할 수 없는 경우 사용한다
② 모수적 검정과 동일한 성능이 나온다
③ ????
④ ????
18. 상관분석의 R 결과를 보고 해석하는 문제
① Sales과 ????의 상관계수는 유의하지 않다
② Sales과 가장 연관 있는 변수는 price이다
③ Price가 증가하면 sales는 감소한다
④ Sales와 price는 선형관계에 있다
19. 표본과 신뢰구간에 대한 설명으로 바르지 않은 것은?
① 가설 검정 시 표본이 커지면 신뢰구간이 작아진다
② 95% 신뢰구간이란 그 신뢰구간에 모수가 있을 확률이 95%이다
③ ????
④ ????
20. 사립학교, 등록금, 학급 내 성적 상위 10%비율 등을 독립변수로 하고 학교 졸업률을 설명변수로 한 회귀식을 R 프로그래밍 해서 해석하는 문제
① ????
② 영향력이 가장 큰 변수는 ????이다
③ 사립학교일 때 졸업할 확률이 더 크다??
④ ????
21. 통계적 추론에 대한 설명 중 바르지 않은 것은?
① ????
② 분산 오차는 t-검정으로 확인한다
③ 모집단이 정규분포를 따르지 않더라도 중심극한정리에 따라 모집단 모수를 정규분포에 근사하여 추정할 수 있다
④ 두 변수의 분산이 동일하지 않을 때 검정을 위해 검정통계량 F-검정을 시행한다
22. ????
23. ????
24. ????
25. 계통추출법 설명 후 이 추출법의 이름은 무엇인가?
계통추출법
26. 옳은 귀무가설을 기각시키는 오류는 무슨 오류인가
제 1종 오류
27. 데이터 마이닝을 적합한지 검증할 때 데이터를 구축용과 검정용, 시험용으로 나눈다. 이러한 분석 검증 방법을 무엇이라 하는가
데이터 분할
28. 통계분석 시 모집단에서 추출한 것은?
샘플. 표본집단
29. 연관분석 알고리즘
apriori
30. 텍스트 마이닝에서 어간 별로 분리하여 저장하는 거??
스테밍
1,2과목은 거의 다 복원을 했다. 다만, 긴 설명이나 긴 예시 문장 같은 것들은 다 기억해내지 못해서 짧게 요약하거나 물음표로 해놨다. 가령, 1과목의 8번 같은 문제의 경우는 보기에 대한 기억이 답 밖에 기억나지 않아서 답만 복원할 수 있었다. 그래도 꽤 많이 복원한 편 아닌가?? ㅋㅋ
3과목의 경우 캡쳐화면도 많았고 표 문제도 많아서 복원을 많이 못했는데..주관식은 모두 다 복원했다. 주관식은 답을 같이 적어놨고, 객관식은 답을 안 적어놨는데.. 솔직히 객관식은 답이 무엇이라고 확신하지 못했기 때문 ㅎㅎㅎㅎㅎ 주관식은 교재를 찾아서 다 답을 찾아놨당 ㅎㅎㅎㅎㅎ
다음 시험을 준비하는 분들께 조금이라도 도움이 되길!!
복원문제는 워드로 다운받을 수도 있게 해놨다.
[출처] [ADsP] 제12회 데이터분석준전문가 시험 복원|작성자 욤다
광고 클릭에서 발생하는 수익금은 모두 웹사이트 서버의 유지 및 관리, 그리고 기술 콘텐츠 향상을 위해 쓰여집니다.