public static class AICloudLASRConfig.TaskParam
extends java.lang.Object
Constructor and Description |
---|
TaskParam(AICloudLASRConfig.AudioParam audioParam,
int fileLen)
构造方法
|
Modifier and Type | Method and Description |
---|---|
AICloudLASRConfig.AudioParam |
getAudioParam() |
java.lang.String |
getCallback() |
double |
getCheckLength() |
int |
getFileLen() |
java.util.List<java.lang.String> |
getHotwords() |
java.lang.String |
getLang() |
java.lang.String |
getLmid() |
java.lang.String |
getPhraseFileId() |
java.lang.String |
getRes() |
java.lang.String |
getSensitiveFileId() |
int |
getSpeakerNumber() |
int |
getSpeakerRate() |
int |
getTaskType() |
boolean |
isUseAux() |
boolean |
isUseFullstop() |
boolean |
isUseInverseTxt() |
boolean |
isUseParagraph() |
boolean |
isUseSegment() |
boolean |
isUseTxtSmooth() |
boolean |
isValid() |
void |
setAudioParam(AICloudLASRConfig.AudioParam audioParam)
音频参数
|
void |
setCallback(java.lang.String callback)
识别完成时的回调HTTP(s)地址。当设置了callback地址,当识别融合后,会把最终结果以POST方式回传(也可以通过/lasr/task/result的方式来主动获取)。
|
void |
setCheckLength(double checkLength)
音频的时长(单位:秒), 用户校验剩余时长是否充足
|
void |
setFileLen(int fileLen)
音频文件长度。单位:byte
|
void |
setHotwords(java.util.List<java.lang.String> hotwords)
自定义的热词列表。每个词用英文逗号分割,中文必须使用utf-8编码,单个词必须在2 ~10个汉字之间,热词列表不能超过1000个词。
|
void |
setLang(java.lang.String lang)
语种支持。
|
void |
setLmid(java.lang.String lmid)
自训练模型文件LMID。对应的二路模型文件在:CUSTOME_LM_FILES_ROOT/productId/lmid/latest/lm.pat
|
void |
setPhraseFileId(java.lang.String phraseFileId)
用户的热词文件ID。 绝对路径为: PHRASE_FILES_ROOT/phrase_file_id/v1.txt
|
void |
setRes(java.lang.String res)
资源场景支持
|
void |
setSensitiveFileId(java.lang.String sensitiveFileId)
用户的敏感词文件ID。绝对路径为: SENSITIVE_FILES_ROOT/sensitive_file_id/v1.txt
|
void |
setSpeakerNumber(int speakerNumber)
否
发音人个数,可选值:-1-8。0:表示跳过说话人聚类 。大于0:音频里发音人个数。默认值:-1:盲分。备注:
跳过说话人聚类时,任务的最终result里,没有speaker信息。
跳过说话人聚类时,任务的最终metrics指标里,没有diarizated_t。
|
void |
setSpeakerRate(int speakerRate)
说话人聚类使用的采样率。
|
void |
setTaskType(int taskType)
任务类型,1:机器转写任务(1小时音频,5分钟之内),默认值。2:人机混合任务(1小时音频,15分钟之内)。3:人工转写任务(1小时音频,24小时之内)
|
void |
setUseAux(boolean useAux)
是否返回情绪(emotion) / 年龄(age) / 性别(gender)信息。
默认值:false, 不返回。
设置为true时,返回值里回增加emotion, age, gender字段。
|
void |
setUseFullstop(boolean useFullstop)
是否以中文句号作为分句。默认值:false
|
void |
setUseInverseTxt(boolean useInverseTxt)
逆文本转换开关。false:不使用,true:使用(默认)。
|
void |
setUseParagraph(boolean useParagraph)
是否在分词结果中增加语义分段标志。默认值:false。值为true时开启,本参数仅限useSegment=true时有效
|
void |
setUseSegment(boolean useSegment)
是否返回每个分词的信息。默认值:false, 不返回。
|
void |
setUseTxtSmooth(boolean useTxtSmooth)
口语顺滑开关。false:不使用,true:使用(默认)。
|
java.lang.String |
toString() |
public TaskParam(AICloudLASRConfig.AudioParam audioParam, int fileLen)
audioParam
- 音频参数fileLen
- 音频文件长度public boolean isUseParagraph()
public void setUseParagraph(boolean useParagraph)
useParagraph
- public boolean isUseAux()
public void setUseAux(boolean useAux)
useAux
- public boolean isValid()
public java.lang.String toString()
toString
in class java.lang.Object
public AICloudLASRConfig.AudioParam getAudioParam()
public void setAudioParam(AICloudLASRConfig.AudioParam audioParam)
audioParam
- 音频参数public int getFileLen()
public void setFileLen(int fileLen)
fileLen
- 音频文件长度public int getTaskType()
public void setTaskType(int taskType)
taskType
- 任务类型,默认1 机器转写public boolean isUseTxtSmooth()
public void setUseTxtSmooth(boolean useTxtSmooth)
useTxtSmooth
- 口语顺滑开关public boolean isUseInverseTxt()
public void setUseInverseTxt(boolean useInverseTxt)
useInverseTxt
- 逆文本转换开关public java.lang.String getCallback()
public void setCallback(java.lang.String callback)
callback
- 识别完成时的回调HTTP(s)地址public double getCheckLength()
public void setCheckLength(double checkLength)
checkLength
- 音频的时长public int getSpeakerNumber()
public void setSpeakerNumber(int speakerNumber)
speakerNumber
- 发音人个数,默认0:表示跳过说话人聚类public boolean isUseSegment()
public void setUseSegment(boolean useSegment)
useSegment
- 是否返回每个分词的信息public boolean isUseFullstop()
public void setUseFullstop(boolean useFullstop)
useFullstop
- 是否以中文句号作为分句public java.lang.String getRes()
public void setRes(java.lang.String res)
res
- 资源名public java.lang.String getLang()
public void setLang(java.lang.String lang)
可选值: cn(默认值, 中文), en(英文), ce(中英文混合),sichuantone-mix(四川话+普通话), cantonese-mix(粤语+普通话)
当客户端没有传lang参数时,等同于lang=cn。
lang
- 语种public int getSpeakerRate()
public void setSpeakerRate(int speakerRate)
可选值: 16000(默认值同sample_rate), 8000, 0 表示没有设置
客户端没有传递speaker_rate参数时,等同于sample_rate。
speaker_rate设置为8000时,会导致即使sample_rate为16000时,说话人仍然使用8000采样率的资源。
speakerRate
- 说话人聚类使用的采样率public java.lang.String getPhraseFileId()
public void setPhraseFileId(java.lang.String phraseFileId)
(警告) (注意):和hotwords参数只会有一个生效。
phraseFileId
- 用户的热词文件IDpublic java.util.List<java.lang.String> getHotwords()
public void setHotwords(java.util.List<java.lang.String> hotwords)
(警告) (注意):和phrase_file参数只会有一个生效。
hotwords
- 自定义的热词列表public java.lang.String getLmid()
public void setLmid(java.lang.String lmid)
lmid
- 自训练模型文件LMIDpublic java.lang.String getSensitiveFileId()
public void setSensitiveFileId(java.lang.String sensitiveFileId)
sensitiveFileId
- 用户的敏感词文件ID