코드 한줄로 중복된 내용 변경하기
csv 파일에서 오디오 경로가 audio로 되어있는데 audio.8k로 바꾸고 싶을 때 해당 파일에 있는 모든 audio
를 audio.8k
로 바꾸는 가장 쉬운 방법이다.
# 기본적인 세팅은 다음과 같다. 여기서 :대신에 /로 해도 되고 중복된 세개를 입력하면 된다.
# 그리고 -i는 해당파일에 바로 적용되는 옵션이므로 백업을 해두면 좋다.
sed 's:::g' # sed 's///g'
# -i가 없으면 stdout으로 출력된다.
sed 's:audio:audio.8k:g'
sed 's:audio:audio.8k:g' > new_train.tsv
sed -i 's:audio:audio.8k:g' *.tsv # 모든 tsv파일에 적용한다.
또한 csv 파일을 한번에 shuffle 하는 방법은 다음과 같다.
shuf -o train.shuffled.tsv train.tsv
Leave a comment