반응형

🍕면접 후기

 

직    무 : 빅데이터 엔지니어

결    과 : 불합격

면접비 : 30,000

 

면접을 보기 전 간단하게 필기 시험을 봅니다. (필기에 무엇이 나오는 지는 답변해 드릴 수 없는 점 양해 부탁드립니다. )

그러니 간단하게 전반적인 CS와 회사 홈페이지 및 Git 허브를 잘 참고하시기 바랍니다 !

 


🍔 면접 질문

 

  1. 1분 자기 소개
  2. 회사에 대해 어떻게 알게되었는지 ?
  3. 빅데이터란 무엇인가 ?
  4. 비정형 데이터를 정형화 하는 방법은 ?
  5. 입사후 A와 B 파트가 있는데 어디에 기여하고 싶은지 ?
  6.  스트레스 해소 방법은 ?
  7.  학기를 아직 마치지 않았는데, 출근이 가능한 지 ?
  8.  해당 직무를 지원하기 위해 본인이 한 노력은 무엇인 지 ?
  9.  공백 기간동안 본인이 한 행동은 ?

🍟 면접 후기

필기시험지 내용과 노트북으로 이력서를 보시면서 면접을 보셨습니다. 인사 관계 직원분들은 아니셨던 것 같고, 두 분다 실무자 이였던 것 같습니다. 빅데이터 엔지니어 관련된 기술 하둡, 스칼라, 리눅스 등에 대한 선수 지식이 필요하다고 판단되었습니다.

반응형

'취준 > 기타' 카테고리의 다른 글

2020년 카카오 여름 인턴 면접 후기(+사전과제)  (6) 2020.07.27
반응형

문제 설명 출처

 

수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다.

마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수들의 이름이 담긴 배열 completion이 주어질 때, 완주하지 못한 선수의 이름을 return 하도록 solution 함수를 작성해주세요.

제한사항

  • 마라톤 경기에 참여한 선수의 수는 1명 이상 100,000명 이하입니다.
  • completion의 길이는 participant의 길이보다 1 작습니다.
  • 참가자의 이름은 1개 이상 20개 이하의 알파벳 소문자로 이루어져 있습니다.
  • 참가자 중에는 동명이인이 있을 수 있습니다.

효율성.. 너무 어려운 숙제이다.. 더 많은 공부가 필요할 것 같다 ! 

 

중복값을 확인하기 위해 아래와 같은 코드로 구현했지만.. 호율성에서 문제가 발생했다. 시간 초과 !

def solution(participant, completion):
    tmp = participant.copy()
    res = 0

    for key, value in enumerate(participant) :
        if completion.count(value) != 0 :
            tmp[key] = 'x'
            completion.remove(value)
        else:
            res = key

    answer = tmp[res]            
    return answer

 

올바른 풀이법 

더보기
import collections

def solution(participant, completion):
    answer = collections.Counter(participant) - collections.Counter(completion)
    return list(answer.keys())[0]
반응형
반응형

🍕 서론

운이 좋게  KT 넥스알 빅데이터 엔지니어 신입(인턴) 직무 면접을 보게 되었습니다. 면접을 하루 앞 두고 머리속을 정리하고자 이렇게 글을 남기게 되었습니다.


🍔 본론

● 내가 생각하는 빅데이터 엔지니어란 ?

데이터를 수집, 정제하고 이를 기반으로 다른 구성원들이 해당 데이터를 잘 활용할 수 있도록 도와주는 역활이라고 생각합니다. 또한, 개발된 솔루션을 고객사에서 원할하게 사용할 수 있도록 솔루션 설치 및 기술 지원에 대한 도움까지 주는 포지션이라고 생각합니다. 

 

● OLAP(On-Line Analytical Processing)

온라인상에서 데이터를 분석하고 처리하는 것을 의미합니다. 결과적으로 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정하여 활용하는 과정을 말합니다. 최종 사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원합니다.

 

● OLTP(On-Line Transaction Processing)

효율적인 기업 운영을 지원하기 위해 트랜잭션(처리 정보)을 수집하고 분류, 저장, 유지보수, 갱신, 검색하는 기능을 수행하는 실시간 거래 처리 시스템으로 기업의 본연 업무를 지원하는 기간 시스템입니다. 예로 항공사의 예약 시스템이나 은행의 창구 업무 시스템을 예로 들 수 있습니다. 

 

● OLAP vs OLTP

OLAP는 의사 결정에 도움되는 데이터에 중점을 두고 OLTP는 현재 발생하는 트랜잭션 처리에 중점을 둡니다.

 

● ETL과 데이터 전처리

데이터웨어하우스를 사용하여 추출(Extract), 변환(Transform), 적재(Load) 하는 일련의 모든 과정을 의미합니다. 이렇게 가공돈 데이터를 통해 머신 러닝이나 딥러닝 모델에 적용합니다. 이처럼 올바른 데이터 분석 결과를 얻기 위해 획득한 데이터를 올바르게 처리하는 과정을 데이터 전처리라고 할 수 있습니다.

 

● 데이터 파이프라인

데이터를 분석하고 활용하기 위해서는 분산되어 저장된 데이터들을 한 곳으로 모으는 작업은 필수입니다. 그리고 이를 모으는 매게채 역활을 데이터 파이프라인 이라고 합니다. 이러한 예로 아파치 카프카를 예로 들 수 있습니다.

 

● NoSQL

기존의 정형화된 데이터 뿐만 아니라 메신저 텍스트, 음성 등 비정형화된 데이터가 많이 발생되고 있습니다. 또한, 클라우드 또는 분산형 컴퓨팅이 주목 받기 시작했습니다. 그리고 NoSQL은 분산형 컴퓨팅에 최적화되어 있고  확장성이 뛰어납니다. SQL이 스키마(릴레이션을)을 구성해 Column을 기반으로 사용되었다면, NoSQL은 Key Value, 그래프 등 다양한 데이터 모델을 가지고 있습니다. SQL은 MySQL, MariDB, SQLite 등이 있으며, NoSQL은 MongDB 가 있습니다.

(사용을 안 해봐서 감이 안온다..1)

 

● 하둡(Hadoop)

대용량 데이터의 저장과 분석이 가능한 오픈소스 프레임 워크입니다. 강력한 병렬 프로세싱을 자랑합니다. 실시간 처리가 아닌 배치 형태로 작동됩니다.

(사용을 안 해봐서 감이 안온다..2)

 

● 맵리듀스와 HDFS

맵리듀스는 하둡의 계산을 담당하고 HDFS는 하둡의 스토리지(공유 데이터)를 담당합니다.

  1. 맵 리듀스 - 데이터 처리를 위한 프로그래밍 모델
  2. HDFS - 네트워크로 연결된 여러 머신의 스토리지를 관리하는 하둡의 저장소 역할

● 카프카(Kafka)

링크드인에서 개발된 프레임 워크로 실시간 스트림 프로세싱 분야에서 하둡과 같은 존재입니다.

 

● 스파크(Spark)

범용적인 분산 환경을 고성능 클러스터링 플랫폼입니다. 메모리에서 동작하므로 하둡보다 100배 빠른 속도를 보장합니다.

 

● 주키퍼(Zookeeper)

분산 시스템을 위한 코디네이터입니다.

 

● 나이파이(Nifi)

데이터 흐름을 모니터링하기 위한 프레임 워크입니다.

 

반응형

'취준 > 면접 준비' 카테고리의 다른 글

[면접준비] 스프링 개발자 / 백엔드 개발자  (0) 2020.08.26
반응형
 

강원도 마스크 – ONE store

건강한 강원도를 위해! ● 국내, 강원도 코로나 현황을 알려드립니다. ● 전국 공적마스크 판매 정보를 알려드립니다. ● 강원도내 선별진료소를 알려드립니다. ☞ 개발자 정보 - 이메일 : computer

onestore.co.kr

포트폴리오 구성


  • 강원도 마스크
    • 기술 스택 : Android
    • 라이브러리 : Jsoup, Okhttp3, Kakao map
    • 프로젝트 기간 : 10일
    • 프로젝트 내용 : 국내와 강원도의 코로나 확진자 현황과 공적 마스크 판매 정보를 알려주는 앱

  • 2020-08-01 추가 (공공데이터 공적마스크 중단으로 인한 코드 수정이 필요합니다.)

 

🍙  코드 보러 가기  🍙

 

korean-sh/CovidApplication

Contribute to korean-sh/CovidApplication development by creating an account on GitHub.

github.com

반응형

+ Recent posts