데이터마이닝 :: 빅데이터 분석의 핵심 기술

2021. 6. 8. 15:17ㆍIT이야기

반응형

데이터마이닝 :: 빅데이터 분석의 핵심 기술

안녕하세요, IT 포스팅의

"아이티 유단자" 입니다.

빅데이터 분석 과정에 있어서

빅데이터 분석이 이루어지는

5가지 과정에 대해서

설명해드린 적이 있었습니다.

빅데이터 분석은 크게

데이터의 수집

데이터의 저장

데이터의 분류

데이터의 분석

데이터의 예측

과정으로 나누어지는데요.

그중에서 가장 중요한

데이터를 선별해서

수집하는 과정

마치 금광에서 금을

채굴하는 것과 같다는 의미로

'마이닝'이라는 단어를 사용해

데이터마이닝이라 불리는

과정이 그것이라 볼 수 있겠습니다.

이 데이터마이닝은

데이터베이스 속에 존재하는

유용하고 가치 있는 정보들을

찾아서 저장하는 행동인데요.

우리가 어떤 사진을 보고

'저장해두고 싶다' 라고 생각해서

저장하는 개념이 작은 의미의

데이터마이닝이라고

볼 수 있겠습니다.

물론, 빅데이터 영역으로

들어가게 될 경우

이러한 자료를 선택적으로

일일이 가져오는 것은

효율성도 떨어질 뿐 아니라

시간도 많이 소요되는데요.

데이터마이닝에서

가장 활용도가 높은 것이

데이터 크롤링으로

내가 지정한 키워드나

조건에 맞는 자료들을

모두 가져오는 기능이

데이터 크롤링입니다.

빅데이터를 배움에 있어서

초기 과정으로 많은 사람들이

파이썬을 추천하곤 하는데요.

데이터마이닝, 다시 말해

데이터 크롤링을 함에 있어

이러한 자동화 프로그램을

파이썬으로 많이 만들기에

파이썬 교육이 필요한 것입니다.

파이썬은 사람이 해야 할

손이 많이 가는 작업도

자동으로 할 수 있게끔

프로그램을 만들 수 있는데요.

다양한 자동화 프로그램이나

매크로들을 만드는 데

상당히 유용할 뿐 아니라

데이터마이닝을 함에 있어서도

꼭 알아두어야 할

프로그래밍 언어입니다.

데이터마이닝은 빅데이터의

한 축을 담당하는 영역으로

컴퓨터 이외의 영역에서도

많은 활용이 되는 기술인데요.

생명공학이나 유전자분석

사례 기반 추론 및 기계학습

머신러닝 분야에서도

많은 활용이 되는 과정입니다.

실제로, 데이터마이닝으로

추출한 바둑 기보를

머신러닝을 통해 개발한

A.I에 주입하는 것으로

만들어진 인공지능이

알파고의 후예라고 불리는

한돌 인데요.

빅데이터 과정은 이처럼

단순히 자료들을 다루는 것

뿐만이 아니라

누군가에게는 사소한 정보

일지라도, 그 속에서

연결고리를 발견해내고

그 속에서 유용하거나

돈이 되는 정보,

필요로 하는 정보를

발견해 내는 것입니다.

빅데이터 분석의

최초의 시작을 담당하는

데이터마이닝을 얼마나

잘 하는지에 따라

이러한 정보들의 정확도가

높아지게 되는데요.

아이티뱅크를 통해서

데이터마이닝을 제대로 배워보고

빅데이터 수업까지 연결되도록

단계적으로 교육을

받아보시길 바라겠습니다.

이번 포스팅에선 여러분께

데이터마이닝에 대해

빅데이터와의 연관성을

설명드리는 시간을 가져보았는데요.

추가적인 궁금증이나

데이터마이닝 수업이

필요하신 학생분들은

아래의 번호로 연락 주시고

홈페이지와 오픈 카톡으로도

문의 남기실 수 있으니

많은 이용 부탁드리겠습니다.

 

반응형