less than 1 minute read

csv 파일에서 오디오 경로가 audio로 되어있는데 audio.8k로 바꾸고 싶을 때 해당 파일에 있는 모든 audioaudio.8k로 바꾸는 가장 쉬운 방법이다.

# 기본적인 세팅은 다음과 같다. 여기서 :대신에 /로 해도 되고 중복된 세개를 입력하면 된다.
# 그리고 -i는 해당파일에 바로 적용되는 옵션이므로 백업을 해두면 좋다.

sed 's:::g' # sed 's///g' 

# -i가 없으면 stdout으로 출력된다.
sed 's:audio:audio.8k:g'
sed 's:audio:audio.8k:g' > new_train.tsv
sed -i 's:audio:audio.8k:g' *.tsv  # 모든 tsv파일에 적용한다.

또한 csv 파일을 한번에 shuffle 하는 방법은 다음과 같다.

shuf -o train.shuffled.tsv train.tsv

Tags:

Categories:

Updated:

Leave a comment