본문 바로가기
카테고리 없음

엑셀과 구글 시트에서 텍스트 정리 완벽 가이드 - 공백 제거부터 중복 삭제까지

by 시트자동화 2025. 10. 21.

엑셀 관련 이미지
엑셀

외부에서 가져온 데이터나 수작업으로 입력한 텍스트가 뒤죽박죽이라 고민이신가요? 불필요한 공백, 일관성 없는 대소문자, 중복된 데이터는 분석을 방해하고 오류를 발생시킵니다. 깔끔한 데이터는 정확한 분석의 시작점입니다. 불필요한 공백을 한 번에 제거하는 함수 활용법을 통해 앞뒤 공백과 중간의 과도한 공백을 정리하는 방법을 배우고, 대소문자 통일로 데이터 일관성 확보하는 실전 테크닉으로 검색과 비교가 정확하게 이루어지도록 만드는 기술을 익히게 됩니다. 마지막으로 중복 데이터를 찾아내고 제거하는 다양한 방법까지 습득하면 데이터 품질을 획기적으로 높일 수 있습니다. 실무에서 즉시 적용 가능한 구체적인 방법들을 단계별로 안내해드리겠습니다.

불필요한 공백을 한 번에 제거하는 함수 활용법

데이터를 외부 시스템에서 가져오거나 복사할 때 가장 흔하게 발생하는 문제가 불필요한 공백입니다. 텍스트 앞뒤에 보이지 않는 공백이 있으면 같은 내용이라도 다른 데이터로 인식되어 검색, 필터, 조인 작업에서 오류가 발생합니다. TRIM 함수는 이러한 문제를 해결하는 가장 기본적인 도구입니다. =TRIM(A1)을 입력하면 A1 셀의 텍스트 앞뒤 공백을 모두 제거하고, 단어 사이의 공백은 하나만 남겨둡니다. 예를 들어 "" 서울 시 강남구 ""처럼 앞뒤에 공백이 있고 중간에 과도한 공백이 있는 텍스트가 ""서울 시 강남구""로 정리됩니다. 여러 셀에 적용하려면 TRIM 함수를 입력한 후 채우기 핸들로 아래로 드래그하면 됩니다. 다만 TRIM 함수는 결과를 새로운 열에 생성하므로, 원본 데이터를 교체하려면 결과를 복사한 후 값만 붙여넣기로 원본에 덮어써야 합니다. 구글 시트에서는 더욱 편리한 방법이 있습니다. 범위를 선택한 후 데이터 메뉴의 공백 제거 옵션을 클릭하면 함수 없이 즉시 모든 공백이 정리됩니다. 이 기능은 선택한 셀들의 앞뒤 공백과 중간의 과도한 공백을 일괄 제거해줍니다. 엑셀에서 함수 없이 공백을 제거하려면 찾기 및 바꾸기 기능을 활용할 수 있습니다. Ctrl+H를 눌러 찾기 및 바꾸기 창을 열고, 찾을 내용에 공백을 입력하고 바꿀 내용은 비워둔 채 모두 바꾸기를 실행하면 모든 공백이 제거됩니다. 하지만 이 방법은 단어 사이의 정상적인 공백까지 제거하므로 주의가 필요합니다. 앞뒤 공백만 제거하려면 정규식을 지원하는 도구를 사용하거나 TRIM 함수를 권장합니다. 탭 문자나 줄바꿈 같은 보이지 않는 문자들도 문제를 일으킬 수 있습니다. CLEAN 함수는 출력할 수 없는 문자들을 제거하며, =CLEAN(TRIM(A1))처럼 TRIM과 함께 사용하면 더욱 완벽한 정리가 가능합니다. 셀 내 줄바꿈을 제거하려면 찾기 및 바꾸기에서 Ctrl+J를 눌러 줄바꿈 문자를 입력하고 공백이나 빈 값으로 대체할 수 있습니다.

대소문자 통일로 데이터 일관성 확보하는 실전 테크닉

영문 텍스트 데이터에서 대소문자가 일관되지 않으면 같은 내용임에도 다른 항목으로 취급되는 문제가 발생합니다. Apple, APPLE, apple은 사람 눈에는 같아 보이지만 컴퓨터는 세 가지 다른 값으로 인식합니다. 이는 필터링, 집계, 중복 제거 작업에서 심각한 오류를 초래합니다. 대소문자를 통일하는 세 가지 주요 함수가 있습니다. UPPER 함수는 모든 문자를 대문자로 변환합니다. =UPPER(A1)을 입력하면 ""Seoul City""가 ""SEOUL CITY""로 변환됩니다. 국가 코드, 제품 코드, 약어 등 대문자로 표준화해야 하는 데이터에 적합합니다. LOWER 함수는 모든 문자를 소문자로 변환합니다. =LOWER(A1)을 사용하면 ""Product Name""이 ""product name""이 됩니다. 이메일 주소, 도메인명, 파일명 등 소문자가 표준인 데이터에 사용됩니다. PROPER 함수는 각 단어의 첫 글자만 대문자로, 나머지는 소문자로 변환합니다. =PROPER(A1)을 적용하면 ""kim HONG gil""이 ""Kim Hong Gil""로 정리됩니다. 사람 이름, 도시명, 제목 등 적절한 대문자 표기가 필요한 데이터에 이상적입니다. 실무에서는 이러한 함수들을 원본 데이터 옆 열에 적용한 후 결과를 확인하고, 문제가 없으면 복사하여 값만 붙여넣기로 원본을 교체하는 방식을 사용합니다. 대소문자 구분 없이 비교해야 할 때도 있습니다. IF 함수와 함께 사용하면 유용합니다. =IF(UPPER(A1)=UPPER(B1), ""일치"", ""불일치"")처럼 작성하면 대소문자와 관계없이 내용이 같은지 판단할 수 있습니다. VLOOKUP에서 대소문자를 무시하려면 =VLOOKUP(UPPER(찾을값), 범위, 열번호, FALSE) 형태로 사용할 수 있지만, 검색 범위의 키 열도 대문자로 변환되어 있어야 합니다. 한글과 영문이 섞인 데이터에서는 이러한 함수들이 영문에만 적용되고 한글은 영향을 받지 않으므로 안전하게 사용할 수 있습니다. 대량의 데이터를 일괄 변환할 때는 보조 열을 만들어 함수를 적용하고, 전체를 복사하여 값으로 붙여넣은 다음 원본 열을 삭제하는 순서로 진행하면 효율적입니다.

중복 데이터를 찾아내고 제거하는 다양한 방법

데이터가 축적되다 보면 동일한 정보가 여러 번 입력되는 중복 문제가 발생합니다. 중복은 집계 오류를 일으키고 저장 공간을 낭비하며 분석 결과를 왜곡시킵니다. 엑셀과 구글 시트는 중복을 처리하는 여러 방법을 제공합니다. 가장 간단한 방법은 기본 제공 기능을 사용하는 것입니다. 엑셀에서는 데이터 탭의 중복된 항목 제거 버튼을 클릭하면 됩니다. 범위를 선택한 상태에서 실행하면 어떤 열을 기준으로 중복을 판단할지 선택하는 대화상자가 나타납니다. 모든 열이 동일한 경우만 중복으로 볼지, 특정 열만 비교할지 설정할 수 있습니다. 중복이 제거되면 몇 개의 중복 값이 삭제되고 몇 개의 고유 값이 남았는지 알려주는 메시지가 표시됩니다. 구글 시트에서도 데이터 메뉴의 중복 항목 삭제 옵션을 사용할 수 있으며, 작동 방식은 엑셀과 유사합니다. 중복을 제거하지 않고 표시만 하고 싶다면 조건부 서식을 활용할 수 있습니다. =COUNTIF($A$1:$A$100,$A1)>1 같은 수식으로 범위 내에 같은 값이 2개 이상 존재하는 셀을 색상으로 강조할 수 있습니다. 이렇게 하면 중복을 시각적으로 확인한 후 수동으로 검토하고 선택적으로 삭제할 수 있습니다. 고급 필터를 사용하면 중복 없이 고유한 값만 추출할 수 있습니다. 엑셀의 데이터 탭에서 고급 필터를 선택하고 중복되지 않는 레코드만 옵션을 체크하면 원본은 그대로 두고 고유한 값만 다른 위치에 복사할 수 있습니다. UNIQUE 함수는 구글 시트에서 매우 강력한 도구입니다. =UNIQUE(A1:A100)을 입력하면 해당 범위에서 중복을 제외한 고유한 값들만 자동으로 나열됩니다. 이 함수는 동적이므로 원본 데이터가 변경되면 결과도 자동으로 업데이트됩니다. 부분 중복을 찾는 것도 가능합니다. 예를 들어 이메일 주소에서 도메인 부분만 추출하여 중복을 확인하려면 =COUNTIF(범위, ""*""&""@domain.com"")처럼 와일드카드를 사용할 수 있습니다. 여러 열을 조합하여 중복을 판단해야 할 때는 보조 열을 만들어 =A1&B1&C1처럼 여러 열을 연결한 후 이 보조 열을 기준으로 중복을 제거하는 방법이 효과적입니다. 중복 제거 전에는 반드시 원본 데이터를 백업하거나 복사본에서 작업하는 것이 안전합니다.