[!INFO] 책 정보
- 저자: 저자/서대호
- 번역:
- 출판사: 출판사/반니
- 발행일: 2020-02-25
- origin_title: -
- 나의 평점: 7
- 완독일: 2022-09-29 00:00:00
tags: #_독서록/2022년 #테그없음
1년만에 AI 빅데이터 전문가가 되는법
Sub title:4차 산업혁명 시대의 최고의 직업 Issue date:2020년 02월 25일 출간 #저자/서대호 #출판사/반니
표지

1. 질문 (책 읽전에 먼저 작성할 것)
_경험에 , 왜 읽었나 질문,궁금 등 __
1.1 Qustion 질문
-
(why) 이 책의 제목을 이렇게 지은 이유는?
-
(how) 어떻게 설명하고 있는가? 어떻게 하라고 하는가? 어떻게 해야하는가?
-
(where) 어느 곳에서 쓴 책인가? 어느 것을 위해 쓴건인가? 어디로 가야하는가? 어디에서 읽어야 하나? 그곳은 어떤 곳인가?
-
(when) 이책은 언제 쓰여졌는가? 시대적 배경은 무엇인가? 언제를 기준으로 쓰였는가? 언제 할것인가?
-
(who) 저자는 누구인가? 주인공은 누구이고 어떤 사람들이 나오나? 누구를 위해 저자는 말하는가?
-
(why) 이책을 통한 질문을 만들기
- 질문 1.
- 질문 2.
-
(what) 이 책에서 말하는 주제라는 무엇?
- 알게된 것은 무엇인가?
- 해야할건 먼가?
- 다른 책과 다른 점은 먼가?
- 이 책의 특징은 먼가?
2. 견해
책의 견해
- 작가의 주장과 의견
나의 견해
- 주제에 대해
- 책 읽기전
- 책 읽은 후
- 만약 내가 저자였다면
3.중요 문장 (책 밑줄에서 top 3 선별)
_주요 키 내용 2~3가지로 정리하기 또는 20자 정리 _
4. 내생각
- 배운점
- 느낀 점
- 깨달은 점
- 기타
5.책에서 뽑은 키워드 정리
키워드 1
키워드-제목 1
6.책 밑줄 정리 (책 밑줄 전체,page)
공부방법
- 책으로 시작하라
-
AI 빅데이터의 기본 개념, 저장 및 처리 방식, 활용 사례, 기본적인 분석 기법 등을 망라한 책이 좋다.
- 빅데이터 기초 : 개념, 동인, 기법
- 이론적인 기술보다는 기업에서 빅데이터에 왜 관심이 있는지, 어떠한 비즈니스 문제를 해결하는 데 도움이 되는지, 이를 위해 기업은 전략적・전술적・오퍼레이션적 관점에서 무엇을 해야 하는지, 그리고 톱 매니저, 현업 부서, IT 부서 각자의 역할과 책임은 무엇인지에 대해 기술한다. 그리고 후반에는 빅데이터 저장과 분석에 대한 기본적인 개념과 종류들을 간략히 살펴본다.
- 인공지능 시대의 비즈니스 전략
- 다양한 활용 사례들을 볼 수 있는 책들
- 빅데이터가 만드는 제4차 산업혁명》(북카라반),
- 《빅데이터 비즈니스 이해와 활용》(위즈하임),
- 《빅데이터 분석과 활용》(학지사)
- 빅데이터 기초 : 개념, 동인, 기법
-
유명하고 성과가 잘 나온 이러한 활용 사례들을 읽어보면서 사고를 넓히고 현장에서 비슷한 문제가 발생했을 때 모방하는 능력을 키워야 한다
-
수리 통계학
- 선형대수학도 공부해야 한다. 하지만 수학을 싫어하는 사람들에게 선형대수학까지 강요할 수는 없으니 그나마 조금 쉽고 더 기본이 되는 수리통계학이라도 배우면 좋을 듯하다.
- 수리통계학을 공부해야 선형회귀 모형을 올바르게 생성할 수 있다.
- 수리통계학 개론
딥러닝
- 딥러닝 제대로 시작하기
- 강좌 모두를 위한 딥러닝 - 기본적인 머신러닝과 딥러닝 강좌
- 밑바닥 부터 시작하는 딥러닝
- CNN, LSTM, 오토인코더, GAN 등 다양한 딥러닝 모델들을 공부하고 실제 예제 세트를 코드로 돌려보아야 한다. 딥러닝을 구현하기 위한 라이브러리는 텐서플로를 비롯해 케라스Keras, 카페Caffe, 파이토치Pytorch, 티아노Theano 등 다양하다.
- 케라스를 추천, 이용자 많고, 자료 많음
- 케라스 창시자에게 배우는 딥러닝 - 창시자의 철학까지 담은 머신 러닝/딥러닝 핵심 원리와 실무 기법, 개정 2판
데이터 마이닝
-
기계학습을 이용한 분류, 회귀, 군집 또는 연관 규칙, 빈발 패턴 분석, 아웃라이어 분석과 같은 것들
-
- 데이터에 대한 이해
- 데이터 유형에 따라 어떠한 분석이 사용되는지
- 기본적인 평균, 중위값, 최빈값, 표준편차, 사분위수와 같은 기초 통계들의 개념과 각 기초 통계들이 어떠한 상황에서 쓰여야 데이터를 잘 요약, 표출할 수 있는지 알아야 한다.
-
- 데이터 전처리 기술
- 데이터 정제(결측치 제거 또는 대치, 노이즈 제거), 데이터 통합(중복 데이터 처리, 복사, 단위 통합), 데이터축소(주성분 분석, 속성선택법, 샘플링), 데이터 변환(데이터 정규화, 비닝)과 같은 기술들을 익혀야 한다.
-
- 데이터 분석 알고리즘
- 실제 분석 알고리즘에 대해서 공부를 해야 한다.
- 연관관계 분석,
- 상관관계 분석,
- 빈발 패턴 분석,
- 클래스 분류 분석,
- 클러스터 분석,
- 회귀 분석,
- 아웃라이어 분석 등이 있다.
- 분석들을 세부적으로 살펴보면 수많은 알고리즘이 있다.
- 클래스 분류 분석은 의사 결정 나무,
- 서포트 벡터 머신,
- 베이즈 분류,
- 랜덤포레스트,
- 배깅,
- 부스팅,
- KNN,
- 피드포워드 신경망,
- 퍼지 세트
-
추천 도서
- 《데이터 마이닝 개념과 기법》link(에이콘출판)을 우선 추천한다.
- 무려 900페이지에 달해 꽤 두껍지만 이 한 권만 제대로 이해하고 넘어가도 다른 책을 볼 필요가 없을 정도로 많은 내용을 담고 있다.
- 각 알고리즘을 예제 데이터로 설명해주기 때문에 알고리즘 동작 원리를 훨씬 쉽게 이해할 수 있다.
- 《패턴인식》(교보문고) 또는 《데이터 마이닝 기법과응용》(한나래)도 읽어볼 만하다.
- 이 두 권의 책은 알고리즘에 대한 수학적인 설명을 자세히 서술한 점이 장점이다. 수학적인 원리에 대해서 좀 더 관심이 있는 독자들은 이 두 권의 책을 보는 것을 추천한다
- 《데이터 마이닝 개념과 기법》link(에이콘출판)을 우선 추천한다.
-
저술,논문들
- 국내 저널로는 《지능정보연구》, 《한국경영과학회지》, 《Information Systems Review》를 주로 본다.
- 해외 저널로는 《IEEE Access》, 《IEEE Transactions on BigData》, 《Information Systems Research》를 보고 있다.
- 관련 저널을 선택할 때 팁을 주자면 정보시스템학 계열의 저널을 선택하는 게 좋다.
기타
-
빅데이터 인공지능 공부 방법들
-
《지능정보연구》 저널이 AI 빅데이터 알고리즘에 대해서 전반적으로 많이 다루고 있으며 실제 비즈니스 현장에 적용할 수 있는 사례들을 많이 다루고 있어 쉽고 재밌다
-
무크를 애용한다.
-
코세라를 통해 스탠포드 대학교의 강의를 듣는 게 너무나 재미있다고 한다
-
처음에 공부를 시작할 때 각각의 알고리즘의 동작 원리를 차근차근 이해하며 넘어가야 한다. 구체적인 수식들에 대해서도 이해하면 사실 더 좋긴 하다. 하지만 수식 하나하나를 유도하고 증명하는 과정까지 공부하기가 힘들면 ‘어떤 동작 부분에서 어떠한 수식이 어떠한 이유로 쓰인다’ 정도는 알아야 한다
AI 빅데이터 공부를 하며 개념원리를 익히기 위해서는 교수의 실력, 자질과는 무관하게 무조건 스스로 해야 한다.
- 데이터 과학자의 역량

-
데이터 전처리 능력 또한 전문가가 갖추어야 할 영역이다. 흔히 데이터 분석에서 데이터 전처리 작업이 전체 작업 시간의 70~80퍼센트에 달한다.
-
전문가에 요구되는 가장 중요한 능력 중에 하나가 비즈니스 현장의 문제를 인식하고 데이터가 주어졌을 때 주어진 데이터로 어떻게 비즈니스 문제를 풀 것인가 고민하는 능력이다
-
AI 빅데이터 분석으로 해결 가능한 문제들 우선 가장 처음 시작해야 하는 공부는 수학, 코딩, 알고리즘 등이 아니다. 경영학적으로 기업 문제들이 발생했을 때 어떠한 데이터 분석 기법으로 문제를 해결할 수 있는지 알아야 한다
기본적인 AI 빅데이터의 개념부터 등장 배경, 특성, 저장 및 처리 기술들에 대해서 한번 쭉 훑어보아야 한다.
-
전통적인 데이터와는 다르게 빅데이터의 특성에 무엇이 있고, 저장 및 처리 기술에 어떤 것이 있는지 정도만 알면 된다. 그리고 여기서 파생된 AI의 등장 및 다양한 활용 사례들도 살펴볼 수 있다. 또한 기계학습, 딥러닝에 대한 간단한 개념과 그 안에 종류가 어떤 게 있는지 정도를 살펴볼 수도 있다. 그다음에 다양한 활용 사례들을 보면서 실제 비즈니스 환경에서 어떻게 적용되고 있는지도 알 수 있다. 실제 분석 케이스들을 보면서 분석 결과를 이런 식으로 시각화하고 이런 식으로 보고서를 작성하는구나 느낄 수도 있다. 사실 이러한 공부가 처음에 잘 되어 있어야 공부하는 데 재미도 있고 추후에 실제 분석을 하고 결과를 도출할 때에 어느 정도 모방해서 매끄럽게 결과 보고서를 작성할 수 있다.
-
자격증
- ‘데이터 분석 자격검정’의 교재 《데이터 분석 전문가 가이드》 (한국데이터베이스진흥원)와 ‘경영 빅데이터 분석사’의 교재 《경영 빅데이터 분석사》(한경아카데미)를 보면 빅데이터 분석에 대한 꽤 많은 내용을 두루 익힐 수 있다.
- 사회조사분석사
- ‘데이터 분석 자격검정’ 시험과 ‘경영 빅데이터 분석사’ 동시 시도 후 -> 사회조사 분석사
-
프로그램 언어
- 파이썬 추천
- 파이썬으로 데이터 주무르기
-
#논문
- 대개의 논문이 서론 → 선행 연구 → 연구 방법 → 실험 → 결론
- 서론이라고 하더라도 세부적으로 연구 배경 및 연구 문제 → 연구 동향 → 부족한 연구 부분 → 제안하는 연구 방법의 간단한 요약 → 제안하는 연구 방법의 의의 → 이후 논문 구성으로 쪼갤 수 있다
- 지도교수의 도움을 받거나 직접 머리를 싸매서 어렵게 도출할 필요가 없다. 그냥 자신이 재미있게 읽었던 다른 논문의 논리 전개 방식을 그대로 벤치마킹하면 훨씬 쉽게 논문을 작성할 수 있다. 특히 이제 논문을 처음 쓰기 시작하는 초보자들에게는 이 방법이 효과적이다. 절대 표절이 아니니 겁먹을 필요 없다. 이런 식으로 몇 번 논문을 쓰다 보면 나중에는 벤치마킹을 굳이 하지 않아도 자신만의 논리 전개 방식이 내재화될 것이다. 그다음에는 연구 대상과 연구 방법만 바꾸어서 논문을 쓰기만 하면 된다. 그러다 보면 논문을 쓰는 속도가 훨씬 빨라질 것이다
3. 연관 문서
- [1년 안에 AI 빅데이터 전문가가 되는 법-심화편](1년 안에 AI 빅데이터 전문가가 되는 법-심화편)