알고리즘(algorithm)

[백준][Python] 14426 접두사 찾기

rimrimi 2025. 4. 12. 13:41

문제 링크

https://www.acmicpc.net/problem/14426

 

문제

문자열 S의 접두사란 S의 가장 앞에서부터 부분 문자열을 의미한다. 예를 들어, S = "codeplus"의 접두사는 "code", "co", "codepl", "codeplus"가 있고, "plus", "s", "cude", "crud"는 접두사가 아니다.

총 N개의 문자열로 이루어진 집합 S가 주어진다.

입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 문자열 중 적어도 하나의 접두사인 것의 개수를 구하는 프로그램을 작성하시오.

입력

첫째 줄에 문자열의 개수 N과 M (1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000)이 주어진다.

다음 N개의 줄에는 집합 S에 포함되어 있는 문자열이 주어진다.

다음 M개의 줄에는 검사해야 하는 문자열이 주어진다.

입력으로 주어지는 문자열은 알파벳 소문자로만 이루어져 있으며, 길이는 500을 넘지 않는다. 집합 S에 같은 문자열이 여러 번 주어지는 경우는 없다.

출력

첫째 줄에 M개의 문자열 중에 총 몇 개가 포함되어 있는 문자열 중 적어도 하나의 접두사인지 출력한다.

 


 

풀이

# 입력
n, m = map(int, input().split())
target = [input() for _ in range(n)]
test = [input() for _ in range(m)]

# 사전순 탐색을 위한 정렬
target.sort()
test.sort()

# test가 target의 접두사인지 판단
answer = 0
i, j = 0, 0
while i < n and j < m :
    # 접두사일 경우
    if target[i][:len(test[j])] == test[j] :
        answer += 1
        j += 1
    # 사전순 탐색 : target의 문자열이 test의 문자열보다 나중에 나오면 test의 다음 문자열로 업데이트
    elif target[i] > test[j] :
        j += 1
    # 사전순 탐색 : test의 문자열이 target의 문자열보다 나중에 나오면 target의 다음 문자열로 업데이트
    elif target[i] < test[j] :
        i += 1

print(answer)

1 ≤ N ≤ 10,000, 1 ≤ M ≤ 10,000 이고 문자열의 길이는 최대 500이므로, 완전탐색을 시행하면 50,000,000,000번 연산으로 1초를 훌쩍 초과한다. 따라서 사전순으로 정렬 한 후 탐색하는 방법으로 O(n+m) 안에 해결 할 수 있도록 하였다.