일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- python
- matplot
- dx
- Ai
- SQL
- 시각화
- kaggle
- 빅데이터분석기사
- r
- kt aivle school
- 에이블스쿨
- Eda
- 하계인턴
- 지도학습
- ML
- httr
- 시계열
- 다변량분석
- 웹크롤링
- ggplot2
- 서평
- 딥러닝
- 에트리 인턴
- KT 에이블스쿨
- 소셜네트워크분석
- SQLD
- 한국전자통신연구원
- 에이블러
- arima
- 기계학습
- 한국전자통신연구원 인턴
- 빅분기
- hadoop
- ETRI
- KT AIVLE
- 하둡
- 가나다영
- 머신러닝
- cnn
- 프로그래머스
- Today
- Total
목록분류 전체보기 (221)
소품집
데이터 거버넌스 데이터 거버넌스 구축 시, 단계별로 갖춰야 할 프레임 워크 IBM 데이터 거버넌스 성숙도 모델 데이터 거버넌스의 프로세스를 측정하는 방법 중 하나인 기존 성숙도 모델을 평가하는 것이다. 기존 모델은 소프트웨어 공급 업체, 컨설턴트 또는 데이터 거버넌스 전문가 그룹에서 개발했지만 대부분은 CMM 모델을 기반을 두고 있어 유사점이 많다. 1. Initial - 기업 입장에서 sw를 개발할 때, 필요한 도구와 협력 업체 등 조직화가 없는 상태 2. Managed - 요구사항 관리 (부서별로 기능을 사용할 수 있음). 반복되는 프로세스를 관리한다. 3. Defined - 조직 내에서 다른 부서와 공동 작업을 수행할 수 있다. -> 다른 부서와 데이터베이스 통합이 가능하다. 4. Quantitat..
빅데이터 거버넌스는 IT 거버넌스의 일부 IT 거버넌스의 범위를 확대하여 빅데이터 거버넌스를 포함 IT거버넌스 위원으로 데이터 과학자와 빅데이터 전문가와 같은 전문 인력을 배치 필요 빅데이터 카테고리(ex, 소셜 미디어) 데이터 관리 책임자를 지정 빅데이터 거버넌스는 정책을 체계화하는 활동 정책은 사람들이 주어진 상황에서 어떻게 행동해야 하는 것. 즉, 행동 지침서를 도식화 빅데이터는 최적화 되어야 함 메타데이터 관리 : 빅데이터의 종류를 파악하여 목록 작성 데이터품질 관리: 물리적 자산처럼 빅데이터를 정제하여 품질 관리 수명주기 관리: 더이상 의미가 없는 데이터는 폐기 또는 보관 빅데이터의 프라이버시가 중요 가치 창출 빅데이터도 재정적 자치를 가진 회사의 자산으로 인식해야 함 빅데이터는 기능(부서)들 ..
AI 기술과 고객 경험을 어떻게 연결할 것인가 - 비대면 시대에도 사람들은 여전히 ‘경험’하고 싶어 한다. 접촉하지 않으면서 고객의 경험을 강화하기 위해 AI를 활용하는 기업들이 급증하기 시작했다. - 언택트 생활이 활성화 됨에 따라 코로나19 사태가 종료된다 하더라도 언택트의 편의를 본 사람들이 코로나19 사태 이전으로 돌아가기는 힘들 것. 언택트를 중심으로 활성화 된 우리 사회의 기술 발전을 토대로 일의 생산성을 높일 수 있는 기회가 됨. - 코로나 시대에 언택트가 ‘뉴 노멀’로 자리 잡으면서 기업들에게 AIX 시대가 열리게 될 것이며, 기업들은 저마다의 색깔로 적극적으로 시대의 흐름에 대응하며 미래 먹거리와 새로운 가치를 창출할 것으로 기대된다. 책 재밌게 봤는데 정리 안하고 반납해서 이 것만 남았..
1. 상관계수 공분산 - 두 확률 변수 사이의 관계를 선형관계로 나타낼 때 두 변수 사이의 상관 정도를 타나내며 다음과 같이 구합니다. 두 확률변수 X, Y의 공분산은 𝐶𝑜𝑣 (𝑋, 𝑌 )로 표기하며, 공분산이 갖는 값에 따라 두 확률변수의 관계를 파악할 수 있습니다. 𝐶𝑜𝑣 𝑋, 𝑌 > 0 : 두 확률변수 𝑋, 𝑌 의 변화가 같은 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 도 증가하고, 반대로 한 변수가 감소하면 같이 감소합니다. 𝐶𝑜𝑣 𝑋, 𝑌 < 0 : 두 확률변수 𝑋, 𝑌 의 변화가 다른 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 는 감소, 즉 한 변수가 감소하면 다른 변수는 증가합니다. 𝐶𝑜𝑣 𝑋, 𝑌 = 0 : 두 확률변수 간에 어떠한 (선형) 관계가 없음을 나타냅니다. 상관계수 [-1~1] ..
https://blog.lgcns.com/903?category=515146 클라우드 네트워크, SDN과 NFV 지난 연재시간에는 클라우드 환경의 중요한 구성 요소 중 하나인 ‘클라우드 스토리지’ 관련 내용에 대해 설명해 드렸는데요. 이번 시간에는 클라우드 구성의 또다른 핵심요소인 네트워크 분 blog.lgcns.com 공부해야딤
먼저 클라우드의 가상화 기술을 살펴보기전, 하이퍼바이저의 역할을 알아봅시다. 위 그림은 하이퍼바이저의 위치 및 역할의 차이에 따라 Type1과 Type2로 나눌 수 있습니다. 하이퍼바이저는 가상머신과 하드웨어 사이에 위치하며, N개의 가상머신을 동작할 수 있게 해주는 가상화 플랫폼 역할을 수행합니다. Type1 Type1은 주로 서버 개발에 사용되며, 하이퍼바이저가 다수의 VM(Virture Machine)을 관리하는 형태입니다. 이 타입은 가상머신에 설치된 게스트 운영체제가 하드웨어 위에서 2번째 수준으로 구동됩니다. 위 방식은 하이퍼바이저가 하드웨어 통제권을 가지고 있는 장점이 있으며, Guest OS에 빠르게 전달하기 위한 API를 따로 가지고 있어 각각의 Guest OS에게 필요한 정보를 빠르게 ..
부하 분산(Load Balancing)이란 처리해야 할 업무 혹은 요청을 분배하여 처리하는 것을 의미합니다. 조직에서 조직장이 외부로부터 받아 처리해야 할 업무를 팀원에게 나누어 주는 행위 또한 부하분산으로 볼 수 있습니다. 서버 부하분산의 종류 서버에게 부하를 고르게 분산하는 것도 다양한 방법이 있습니다. 서버의 능력을 고려하여 분배해야지 서버가 다운되지 않기 때문에 서버의 상황에 맞춰 적절한 방법을 선택해야 합니다. Round Robin Round Robin은 로드 밸런서가 다수의 서버에게 순서대로 요청을 할당하는 방법으로, 프로세스에 우선순위를 두지않고, 시간순서대로 할당됩니다. 로드 밸런스는 여러대의 서버에 하나씩 분배하기 때문에 서버 성능이 비슷하고, 세션이 오래 지속되지 않는 경우에 적합합니다..
다음 조건과 같은 이미지를 학습하는 CNN의 각 레이어별 입력 데이터와 출력 데이터의 Shape을 계산해 보고 네트워크가 학습시키는 파라미터의 개수를 계산해 보겠습니다. 입력 데이터 Shape: (39, 31, 1) 최종 분류 클래스: 100 Layer 1의 Shape과 파라미터 Layer 1은 1개의 Convolution Layer와 1개의 Pooling Layer로 구성됩니다. 두 레이어의 출력 데이터 shape과 파라미터는 다음과 같이 계산 가능합니다. 1.1 Convolution Layer1 convolution layer1의 기본 정보는 다음과 같다. 입력 shape = (39, 31, 1) 입력 채널 = 1 필터 = (4, 4) 출력 채널 = 20 stride = 1 출력 데이터(Activat..
http://taewan.kim/post/cnn/ CNN, Convolutional Neural Network 요약 Convolutional Neural Network, CNN을 정리합니다. taewan.kim 이해완!! (10.5)
https://tensorflow.blog/a-guide-to-convolution-arithmetic-for-deep-learning/ A guide to convolution arithmetic for deep learning 이 글은 원 저자들의 허락하에 번역되어 게재 되었습니다. 이 글의 원문은 여기에서 다운 받을 수 있습니다. 딥 러닝을 위한 콘볼루션 계산 가이드 Vincent Dumoulin(MILA, 몬트리올 대학), Francesco Visin( tensorflow.blog