4 min read

[AWS] 2023-10-11. AWS Industry Week 참가 후기

오늘 AWS Industry Week에 참가했다. 비즈니스의 미래를 만들어 가는 산업별 클라우드 전략이라는 큰 주제로 총 6개의 산업별로 6타임에 걸쳐서 진행을 하는 세션 이다. 그래서 이번에 회사의 팀차원에서 참석을 하게 되었고, 사실 처음에는 반신반의 하면서 참가 하게 되었다. 왜냐하면 2019년부터 AWS를 접하고 조금씩 사용해 보았고, 여러 매체에서도 클라우드의 중요성에 대해 들었지만 체감으로 명확하게 제대로 인프라가 구축되었던 사례를 제대로 듣지 못했던 것 같았다. 금융이나, 제조 쪽은 말할것도 없고, 당장에 On-premise 환경을 그대로 이관 하는 과정 자체도 매우 복잡하고 길기 때문이었던 것 같다.


그러나 오늘은 달랐다. 자세한건 맨 마지막 총평에서..

도착을 하니 여러 부스에서 6개 산업별로 홍보 하고 6개 산업에서 각 1개 이상의 도장을 찍으면 사은품을 줬다. 다음은 도장과 사은품 사진

세션 & 일정

다음은 세션과 일정이다. 나는 여기서 인프라 구축 / MLOPs / SageMaker 에 중점을 두고 들었다. 내가 참여한 세션은 다음과 같다.

  1. 제조 - SK디스커버리 DT 여정: 지주사 중심의 통합 데이터레이크 구축
  2. 통신 및 미디어- SK Broadband의 생성형 AI 서비스 구축을 위한 Amazon SageMaker JumpStart 활용기
  3. 하이테크- AI를 활용한 전기자동차(EV)안전진단 - LG에너지솔루션의 MLOps 구축기
  4. 제조 - 두산에너빌리티의 DX추진방향 및 예측 진단 솔루션 사례
  5. 하이테크 - 데이터 중심의 조직을 위한 LG전자의 데이터 플랫폼 구축 여정
  6. 리테일 - 29CM 데이터 사이언티스트들의 손쉬운 MLOps 인프라 구축 이야기

여기 총 6개의 세션중에서 인상 깊었던 몇개만 추려서 후기를 작성 하려고 한다.

1. 제조- SK디스커버리 DT 여정: 지주사 중심의 통합 데이터레이크 구축

첫번째 세션은 제조의 ’SK디스커버리 DT 여정: 지주사 중심의 통합 데이터레이크 구축’로 선택 했다. 에초에 데이터 레이크로서 AWS S3나, GCP의 Cloud Storage에 관심이 많아서 이쪽을 선택했다. SK 디스커버리의 사례를 통해 세션이 진행 되었다.

기존의 물리서버에서 클라우드로 옮겨야 하는데 특히 제조의 경우 데이터가 제대로 구축되기가 힘든 구조였으며, 기존에 형성된 데이터 파이프라인의 구축을 변경하는것이 매우 어려운 상황이었다.

그리고 총 3번의 시행착오가 있었다고 한다.

  • 시행착오 1: 아키텍쳐> 멀티 데이터 레이크 구성
  • 시행착오 2: 인프라> multiple accounts Role Switching 변경
  • 시행착오 3: 서비스 역할 구성 > AWS Lake Formation

현재까지는 세번째 시행착오 까지 진행 되었으며, 앞으로도 인프라를 계속 업데이트 해나갈 예정이라고 한다.

상당히 관심이 갔으며 질문을 하려고 했는데, 질의응답 하는 시간이 없어서 끝나고 따로 가서 질문을 드렸다.

  • Q: 상당히 많은 시행착오가 있었는데, 팀원은 몇명이며 총 얼마나 걸렸는지.
  • A: 팀원은 약 10명이며 7개월 가량 소요
  • Q: 7개월이 혹시 야근으로 꽉찬 7개월인지.
  • A: 야근은 거의 안한 7개월

이렇게 첫번째 세션이 끝났다.

2. 통신 및 미디어- SK Broadband의 생성형 AI 서비스 구축을 위한 Amazon SageMaker JumpStart 활용기

두번째 세션은 SK BroadBand의 생성형 AI 서비스 구축에 관한 내용이었다. SK 브로드밴드에서 진행 했던 목적으로는 콜센터 또는 CS의 인공지능을 개선 하여, 업무에 적용 하기 위함이라고 한다.

그리고 sLLM 이야기가 나왔다. 대형 언어모델인 LLM(Large Language Model, LLM) 대신에 소형 언어모델인 sLLM(small Large Language Model, sLLM) 전략을 내세운 것이다. 그 이유는 매개변수가 비교적 작기 때문에 자원을 무리하게 소모할 필요도 없으며, SK의 전략은 모든 지식을 얻을 필요는 없다. 고객의 질의 응답에 필요한 지식만 있으면 된다. 전략 때문에 그렇게 진행을 하게 되었다.

그러나 결과적으로 현재까지는 시기상조이고, 내년에 다시 두번째 진행을 한다고 한다. 왜냐하면 한계가, 우선 도메인 특화 학습을 하는데 이 부분이 꽤나 어려운 부분이었다고 한다. 이 도메인이 통신사 관련 정책이기 때문에 자주 바뀌는 최신 정책을 반영하여 유지 하는데 어려움이 있다고 한다.

그럼에도 AWS와 같이 여러개의 모델을 테스트 해보고 있으니 내년을 기대해볼 수 있을것 같다.

5. 하이테크 - 데이터 중심의 조직을 위한 LG전자의 데이터 플랫폼 구축 여정

이번에는 LG전자의 데이터 플랫폼 구축에 대한 이야기 이다. 첫번째 세션과 비슷한 내용이었는데, 그럼에도 아주 간략하게 적어 본다. LG의 H&A(Home Appliance & Air Solution) 사업본부에서 진행한 세션이며 데이터 기반의 고객 경험 혁신을 위한 클라우드 환경에서의 데이터 플랫폼을 구축 하는것이 목적이다. 여기서 점진적인 구축이라는 표현을 썼는데, 마음에 드는 사진하나 찍어서 가져와 봤다.

2021년부터 중/장기적인 로드맵을 만들고 지금도 클라우드 인프라를 구축해 나가는 과정이 매우 인상 깊었다.

6. 리테일 - 29CM 데이터 사이언티스트들의 손쉬운 MLOps 인프라 구축 이야기

마지막으로 29CM의 MLOps 구축에 대한 이야기 이다. 29CM의 추천시스템 소개와 같이 MLOps를 어떻게 구축 해나갔는지에 대한 내용이었다. 기대하고 봤었고, 매우 인상 깊었는데 마지막 세션이라 지쳤는지 제대로 필기도 못하고 기억이 잘 나지 않으니 이상 깊은 사진으로만 대체한다.

총평

가랑비에 옷이 드디어 젖기 시작했다.

드디어 가랑비에 옷이 젖기 시작했다. 맨처음에 이야기 했듯, 반신반의 해서 들어 갔지만 많은 시행착오가 너무 눈에 보였다. 그동안 매번 기사에서는 기대감가능성 만을 주로 다뤘던거 같은데 오늘은 드디어 현실로 다가오고 있는것을 느끼게 되었다. 특히 그 뚫기 어렵다는 제조의 인프라를 바꾸고 있다는 과정이 매우 인상 깊었다. 오늘 AWS 세션은 매우 인상적이었다.